Agent Docs

介绍

# Agent Docs

编写 AI 代理能够高效消费的文档。基于 Vercel 基准测试和行业标准（AGENTS.md、llms.txt、CLAUDE.md）。

## 混合上下文层次结构

用于优化代理性能的三层架构：

### 第 1 层：宪法（内联） **始终在上下文中。** 最多 2,000–4,000 个 token。

```markdown # AGENTS.md > Context: Next.js 16 | Tailwind | Supabase

## 🚨 CRITICAL - NO SECRETS in output - Use `app/` directory ONLY

## 📚 DOCS INDEX (use read_file) - Auth: `docs/auth/llms.txt` - DB: `docs/db/schema.md` ```

**包括：** - 安全规则、架构约束 - 构建/测试/检查命令（置于顶部以利用首因效应） - 文档地图（在哪里查找更多信息）

### 第 2 层：参考库（本地检索） **按需获取。** 1K–5K token 的块。

- 特定框架指南 - 详细风格指南 - API 模式

### 第 3 层：研究助手（外部） **由允许列表限制。** 仅限边缘情况。

- 最新库更新 - 用于处理罕见错误的 Stack Overflow - 第三方 llms.txt

## 为什么这样做有效

**Vercel 基准测试 (2026)：** | 方法 | 通过率 | |----------|-----------| | 基于工具的检索 | 53% | | 检索 + 提示 | 79% | | **内联 AGENTS.md** | **100%** |

**根本原因：** 元认知失败。代理不知道他们不知道什么——他们假设训练数据已经足够。内联文档完全绕过了这一点。

## 核心原则

### 1. 压缩索引 > 完整文档

一个 8KB 的压缩索引优于 40KB 的完整转储。

**压缩为：** - 文件路径（代码所在位置） - 函数签名（仅名称 + 类型） - 负面约束（“不要使用 X”）

### 2. 为分块构建结构

RAG 系统在标题处分割。每个部分必须是自包含的：

```markdown ## Database Setup ← Chunk boundary

Prerequisites: PostgreSQL 14+

1. Create database... ```

**规则：** - 前置关键信息（分块器会截断尾部） - 描述性标题（代理按标题文本搜索）

### 3. 内联优于链接

代理无法自主浏览。每个链接 = 工具调用 + 延迟 + 潜在失败。

| 方法 | Token 负载 | 代理成功率 | |----------|------------|---------------| | 完全内联 | ~12K | ✅ 高 | | 仅链接 | ~2K | ❌ 需要获取 | | 混合 | ~4K 基础 | ✅ 两全其美 |

### 4. “迷失在中间”问题

LLM 具有 U 形注意力： - **强：** 上下文开头（首因） - **强：** 上下文结尾（近因） - **弱：** 上下文中间

**解决方案：** 将关键规则放在 AGENTS.md 的**顶部**。治理优先，细节在后。

### 5. 信噪比

剔除所有非必要内容： - 没有“欢迎来到……”之类的序言 - 没有营销文本 - 核心文档中没有更新日志

像 llms.txt 和 AGENTS.md 这样的格式从机制上提高了信噪比。

## llms.txt 标准

供代理使用的机器可读文档索引：

```markdown # Project Name

> One-line project description.

## Authentication

- [Setup](docs/auth/setup.md): Environment vars and init - [Server](docs/auth/server.md): Cookie handling

## Database

- [Schema](docs/db/schema.md): Full Prisma schema ```

**位置：** 域根目录下的 `/llms.txt` **配套文件：** `/llms-full.txt` — 完整的连接文档，已剥离 HTML

## 安全考量

### 内联 = 受信任 AGENTS.md 是代码库的一部分。受控、版本固定。

### 外部 = 攻击面 - 通过隐藏文本进行间接提示注入 - 如果代理可以自由浏览，存在 SSRF 风险 - 依赖外部可用性

**缓解措施：** 域名允许列表，外部检索采用人在回路。

## 反模式

1. **粘贴 50 页** — 触发“迷失在中间” 2. **“参见外部文档”** — 代理无法自主浏览 3. **通用建议** — “编写整洁代码”（请使用具体约束） 4. **仅目录文档** — 没有内容的索引 5. **仅信任检索** — 53% vs 100% 的通过率

## 高级模式

有关 RAG 优化、多框架文档和 API 模板的详细指南，请参阅 [references/advanced-patterns.md](references/advanced-patterns.md)。

## 验证清单

- [ ] 关键治理规则位于文档顶部 - [ ] 总内联上下文在 4K token 以下 - [ ] 每个 H2 部分自包含 - [ ] 没有内联摘要的外部链接 - [ ] 负面约束明确（“不要……”） - [ ] 文件路径和签名，而非完整代码

介绍

更多产品

Summarize

Ontology

Nano Pdf