ClawSkills logoClawSkills

Browser Automation

使用 CLI 命令通过自然语言自动执行 Web 浏览器交互。当用户要求浏览网站、导航网页、从网站

介绍

# Browser Automation

使用 Stagehand CLI 和 Claude 自动化浏览器交互。

### 第一步:环境选择(本地与远程)

该技能会自动在本地和远程浏览器环境之间进行选择: - **如果存在 Browserbase API 密钥**(即 .env 文件中有 BROWSERBASE_API_KEY 和 BROWSERBASE_PROJECT_ID):使用远程 Browserbase 环境 - **如果没有 Browserbase API 密钥**:回退到本地 Chrome 浏览器 - **无需用户提示**:系统会根据可用配置自动进行选择

## 设置(仅需一次)

检查当前目录下的 `setup.json`。如果 `setupComplete: false`:

```bash npm install # Install dependencies npm link # Create global 'browser' command ```

## 命令

所有命令在两种模式下的工作方式完全相同:

```bash browser navigate <url> # Go to URL browser act "<action>" # Natural language action browser extract "<instruction>" ['{}'] # Extract data (optional schema) browser observe "<query>" # Discover elements browser screenshot # Take screenshot browser close # Close browser ```

## 快速示例

```bash browser navigate https://example.com browser act "click the Sign In button" browser extract "get the page title" browser close ```

## 模式对比

| 特性 | 本地 | Browserbase | |---------|-------|-------------| | 速度 | 更快 | 稍慢 | | 设置 | 需要 Chrome | 需要 API 密钥 | | 隐身模式 | 否 | 是 | | 代理/CAPTCHA | 否 | 是 | | 适用场景 | 开发 | 生产/爬取 |

## 最佳实践

1. **先进行导航**,然后再进行交互 2. 在每个命令后**查看截图**以验证结果 3. 在操作描述中**具体明确** 4. 完成后**关闭浏览器**

## 故障排查

- **未找到 Chrome**:安装 Chrome 或使用 Browserbase 模式 - **操作失败**:使用 `browser observe` 来发现可用元素 - **Browserbase 失败**:验证是否已设置 API 密钥和项目 ID

详细示例请参阅 [EXAMPLES.md](EXAMPLES.md)。 API 参考请参阅 [REFERENCE.md](REFERENCE.md)。

更多产品