ClawSkills logoClawSkills

Agent Docs

创建针对 AI 代理消费优化的文档。在编写 SKILL.md 文件、README 文件、API 文档或任何将被 LLM 读取的文档时使用

介绍

# Agent Docs

编写 AI 代理能够高效消费的文档。基于 Vercel 基准测试和行业标准(AGENTS.md、llms.txt、CLAUDE.md)。

## 混合上下文层次结构

用于优化代理性能的三层架构:

### 第 1 层:宪法(内联) **始终在上下文中。** 最多 2,000–4,000 个 token。

```markdown # AGENTS.md > Context: Next.js 16 | Tailwind | Supabase

## 🚨 CRITICAL - NO SECRETS in output - Use `app/` directory ONLY

## 📚 DOCS INDEX (use read_file) - Auth: `docs/auth/llms.txt` - DB: `docs/db/schema.md` ```

**包括:** - 安全规则、架构约束 - 构建/测试/检查命令(置于顶部以利用首因效应) - 文档地图(在哪里查找更多信息)

### 第 2 层:参考库(本地检索) **按需获取。** 1K–5K token 的块。

- 特定框架指南 - 详细风格指南 - API 模式

### 第 3 层:研究助手(外部) **由允许列表限制。** 仅限边缘情况。

- 最新库更新 - 用于处理罕见错误的 Stack Overflow - 第三方 llms.txt

## 为什么这样做有效

**Vercel 基准测试 (2026):** | 方法 | 通过率 | |----------|-----------| | 基于工具的检索 | 53% | | 检索 + 提示 | 79% | | **内联 AGENTS.md** | **100%** |

**根本原因:** 元认知失败。代理不知道他们不知道什么——他们假设训练数据已经足够。内联文档完全绕过了这一点。

## 核心原则

### 1. 压缩索引 > 完整文档

一个 8KB 的压缩索引优于 40KB 的完整转储。

**压缩为:** - 文件路径(代码所在位置) - 函数签名(仅名称 + 类型) - 负面约束(“不要使用 X”)

### 2. 为分块构建结构

RAG 系统在标题处分割。每个部分必须是自包含的:

```markdown ## Database Setup ← Chunk boundary

Prerequisites: PostgreSQL 14+

1. Create database... ```

**规则:** - 前置关键信息(分块器会截断尾部) - 描述性标题(代理按标题文本搜索)

### 3. 内联优于链接

代理无法自主浏览。每个链接 = 工具调用 + 延迟 + 潜在失败。

| 方法 | Token 负载 | 代理成功率 | |----------|------------|---------------| | 完全内联 | ~12K | ✅ 高 | | 仅链接 | ~2K | ❌ 需要获取 | | 混合 | ~4K 基础 | ✅ 两全其美 |

### 4. “迷失在中间”问题

LLM 具有 U 形注意力: - **强:** 上下文开头(首因) - **强:** 上下文结尾(近因) - **弱:** 上下文中间

**解决方案:** 将关键规则放在 AGENTS.md 的**顶部**。治理优先,细节在后。

### 5. 信噪比

剔除所有非必要内容: - 没有“欢迎来到……”之类的序言 - 没有营销文本 - 核心文档中没有更新日志

像 llms.txt 和 AGENTS.md 这样的格式从机制上提高了信噪比。

## llms.txt 标准

供代理使用的机器可读文档索引:

```markdown # Project Name

> One-line project description.

## Authentication

- [Setup](docs/auth/setup.md): Environment vars and init - [Server](docs/auth/server.md): Cookie handling

## Database

- [Schema](docs/db/schema.md): Full Prisma schema ```

**位置:** 域根目录下的 `/llms.txt` **配套文件:** `/llms-full.txt` — 完整的连接文档,已剥离 HTML

## 安全考量

### 内联 = 受信任 AGENTS.md 是代码库的一部分。受控、版本固定。

### 外部 = 攻击面 - 通过隐藏文本进行间接提示注入 - 如果代理可以自由浏览,存在 SSRF 风险 - 依赖外部可用性

**缓解措施:** 域名允许列表,外部检索采用人在回路。

## 反模式

1. **粘贴 50 页** — 触发“迷失在中间” 2. **“参见外部文档”** — 代理无法自主浏览 3. **通用建议** — “编写整洁代码”(请使用具体约束) 4. **仅目录文档** — 没有内容的索引 5. **仅信任检索** — 53% vs 100% 的通过率

## 高级模式

有关 RAG 优化、多框架文档和 API 模板的详细指南,请参阅 [references/advanced-patterns.md](references/advanced-patterns.md)。

## 验证清单

- [ ] 关键治理规则位于文档顶部 - [ ] 总内联上下文在 4K token 以下 - [ ] 每个 H2 部分自包含 - [ ] 没有内联摘要的外部链接 - [ ] 负面约束明确(“不要……”) - [ ] 文件路径和签名,而非完整代码

更多产品