Anydocs Documents

核心概念

AI 可读产物

了解 AI 可读产物的结构和使用场景。

Anydocs 在构建阶段同时生成面向读者搜索和面向机器读取的结果。理解这些产物的分工，才能知道用户该看什么、AI 该读什么。

先区分搜索和 AI 产物

并不是所有 JSON 都适合作为 AI 主输入。

`search-index.<lang>.json`：服务 reader 内搜索，目标是帮助读者查找页面与章节
`llms.txt`：轻量目录式 AI 入口，适合先发现站点结构
`llms-full.txt`：全站顺序文本导出，适合粗粒度 fallback
`mcp/*.json`：结构化机器可读产物，适合 agent 按需读取

文本型 AI 入口

当外部 agent 只需要快速发现或粗读整站内容时，优先看文本型产物。

`llms.txt`：更轻，适合先发现站点和页面入口
`llms-full.txt`：更重，适合一次性获取全站顺序文本
这两类文件都是构建产物，只包含 `published` 内容

结构化机器可读产物

当 agent 需要按页面、导航或内容块精准读取时，优先看 `mcp/`。

`mcp/index.json`：产物索引
`mcp/pages.<lang>.json`：页面级摘要和公开 metadata
`mcp/chunks.<lang>.json`：按块切分的内容，最适合按需读取
`mcp/navigation.<lang>.json`：发布后的导航数据
`mcp/openapi/index.<lang>.json`：API sources 的机器可读索引（配置后生成）

公开边界和可见性

AI 产物并不会暴露源项目中的全部信息。

只有 `published` 页面会进入 `llms.txt`、`llms-full.txt` 和 `mcp/`
`draft` 与 `in_review` 页面保留在 canonical source 中，但不会进入公开 AI 产物
`mcp/pages.<lang>.json` 只暴露 visibility 为 `public` 的 metadata 字段

给 agent 的读取顺序: 先用 `llms.txt` 发现结构，再按需切到 `mcp/navigation.<lang>.json`、`mcp/pages.<lang>.json`、`mcp/chunks.<lang>.json`，通常比直接吞整站文本更稳。

← 多语言支持打开项目 →