介绍
# Browser Automation
使用 Stagehand CLI 和 Claude 自动化浏览器交互。
### 第一步:环境选择(本地与远程)
该技能会自动在本地和远程浏览器环境之间进行选择: - **如果存在 Browserbase API 密钥**(即 .env 文件中有 BROWSERBASE_API_KEY 和 BROWSERBASE_PROJECT_ID):使用远程 Browserbase 环境 - **如果没有 Browserbase API 密钥**:回退到本地 Chrome 浏览器 - **无需用户提示**:系统会根据可用配置自动进行选择
## 设置(仅需一次)
检查当前目录下的 `setup.json`。如果 `setupComplete: false`:
```bash npm install # Install dependencies npm link # Create global 'browser' command ```
## 命令
所有命令在两种模式下的工作方式完全相同:
```bash browser navigate <url> # Go to URL browser act "<action>" # Natural language action browser extract "<instruction>" ['{}'] # Extract data (optional schema) browser observe "<query>" # Discover elements browser screenshot # Take screenshot browser close # Close browser ```
## 快速示例
```bash browser navigate https://example.com browser act "click the Sign In button" browser extract "get the page title" browser close ```
## 模式对比
| 特性 | 本地 | Browserbase | |---------|-------|-------------| | 速度 | 更快 | 稍慢 | | 设置 | 需要 Chrome | 需要 API 密钥 | | 隐身模式 | 否 | 是 | | 代理/CAPTCHA | 否 | 是 | | 适用场景 | 开发 | 生产/爬取 |
## 最佳实践
1. **先进行导航**,然后再进行交互 2. 在每个命令后**查看截图**以验证结果 3. 在操作描述中**具体明确** 4. 完成后**关闭浏览器**
## 故障排查
- **未找到 Chrome**:安装 Chrome 或使用 Browserbase 模式 - **操作失败**:使用 `browser observe` 来发现可用元素 - **Browserbase 失败**:验证是否已设置 API 密钥和项目 ID
详细示例请参阅 [EXAMPLES.md](EXAMPLES.md)。 API 参考请参阅 [REFERENCE.md](REFERENCE.md)。