介绍
# Local Whisper
**在 Telegram 和 WhatsApp 上免费转录语音消息。** 无需 API 密钥。无需付费。在您的 Mac 上运行。
## 问题所在
语音转录 API 需要付费: - OpenAI Whisper: **$0.006/分钟** - Groq: **$0.001/分钟** - AssemblyAI: **$0.01/分钟**
如果您转录大量 Telegram 语音消息,费用会积少成多。
## 解决方案
此技能在您的 **Mac 本地运行** Whisper。质量相同,**零成本**。
- ✅ 永久免费 - ✅ 私密(音频绝不会离开您的 Mac) - ✅ 快速(每条消息约 1 秒) - ✅ 支持离线工作
## ⚠️ 重要提示
- **首次运行会下载约 1.5GB 的模型** — 请耐心等待,这只会发生一次 - **首次转录较慢** — 模型加载到内存中(约 10-30 秒),之后就会瞬间完成 - **已经在使用 OpenAI API 进行转录?** 将您现有的 `tools.media.audio` 配置替换为下面的配置
## 快速开始
### 1. 安装依赖 ```bash pip3 install -r requirements.txt ```
### 2. 启动守护进程 ```bash python3 scripts/daemon.py ``` 首次运行将下载 Whisper 模型(约 1.5GB)。请等待“Ready”消息。
### 3. 添加到 OpenClaw 配置
将其添加到您的 `~/.openclaw/openclaw.json` 中:
```json { "tools": { "media": { "audio": { "enabled": true, "models": [ { "type": "cli", "command": "~/.openclaw/workspace/skills/local-whisper/scripts/transcribe.sh", "args": ["{{MediaPath}}"], "timeoutSeconds": 60 } ] } } } } ```
### 4. 重启网关 ```bash openclaw gateway restart ```
现在来自 Telegram、WhatsApp 等的语音消息将在本地免费转录!
### 手动测试 ```bash ./scripts/transcribe.sh voice_message.ogg ```
## 使用场景:Telegram 语音消息
无需支付 OpenAI API 费用来转录传入的语音消息,将 OpenClaw 指向此本地守护进程即可。永久免费转录。
## 登录时自动启动
```bash cp com.local-whisper.plist ~/Library/LaunchAgents/ launchctl load ~/Library/LaunchAgents/com.local-whisper.plist ```
## API
守护进程运行在 `localhost:8787`:
```bash curl -X POST http://localhost:8787/transcribe -F "[email protected]" # {"text": "Hello world", "language": "en"} ```
## 翻译
任何语言 → 英语:
```bash ./scripts/transcribe.sh spanish_audio.ogg --translate ```
## 系统要求
- 搭载 Apple Silicon 芯片的 macOS (M1/M2/M3/M4) - Python 3.9+
## 许可证
MIT