混合技术术语表

llms.txt

解说

llms.txt 是一个正在讨论的标准，以单一且易于访问的 Markdown 文件格式呈现，旨在为 LLMs ，如 ChatGPT、Google Gemini 或 Claude提供一个简洁、专业的网站内容概述。与 robots.txt 或 sitemap.xml 不同，llms.txt 专为 AI 系统设计，不是列出所有页面，而是仅指向特定的、对 AI 特别相关的内容。llms.txt 涵盖所有结构化措施，允许网站运营者指定：

哪些内容对 LLMs 特别重要
内容的优先级排序方式
哪些部分禁止 AI 系统使用

其目标是帮助生成式 AI 应用高效获取并处理关键内容，同时保持对数据使用的控制，并兼顾 数据保护 与 版权合规。

优点

相关性：确保 LLMs 仅访问经过挑选与验证的内容
可控性：定义哪些数据可供 AI 使用
保护性：屏蔽敏感或受版权保护的内容
透明性：清晰传达对 AI 使用网页数据的规则
高效性：帮助 AI 系统更快、更精准地处理网页信息

关键留意点

指向重点内容的结构化链接清单
简短描述与分类标签
针对不同 Agents 的允许 / 禁止指令
优先级说明
基于 Markdown 的格式化支持

优化事项

确保所列内容的高相关性与高质量
排除未授权或敏感数据
为 AI 提供清晰使用规则
简单实现，便于机器读取

发展趋势

在 AI 内容利用 背景下的重要性不断提升
对 生成式模型透明标准 的需求持续增长
未来可能被纳入 Web 标准 或 法律法规