ClawSkills logoClawSkills

Local Whisper

使用 Apple Silicon 上的 MLX Whisper 为 Telegram 和 WhatsApp 提供免费本地语音转文字。保护隐私,无 API 费用。

介绍

# Local Whisper

**在 Telegram 和 WhatsApp 上免费转录语音消息。** 无需 API 密钥。无需付费。在您的 Mac 上运行。

## 问题所在

语音转录 API 需要付费: - OpenAI Whisper: **$0.006/分钟** - Groq: **$0.001/分钟** - AssemblyAI: **$0.01/分钟**

如果您转录大量 Telegram 语音消息,费用会积少成多。

## 解决方案

此技能在您的 **Mac 本地运行** Whisper。质量相同,**零成本**。

- ✅ 永久免费 - ✅ 私密(音频绝不会离开您的 Mac) - ✅ 快速(每条消息约 1 秒) - ✅ 支持离线工作

## ⚠️ 重要提示

- **首次运行会下载约 1.5GB 的模型** — 请耐心等待,这只会发生一次 - **首次转录较慢** — 模型加载到内存中(约 10-30 秒),之后就会瞬间完成 - **已经在使用 OpenAI API 进行转录?** 将您现有的 `tools.media.audio` 配置替换为下面的配置

## 快速开始

### 1. 安装依赖 ```bash pip3 install -r requirements.txt ```

### 2. 启动守护进程 ```bash python3 scripts/daemon.py ``` 首次运行将下载 Whisper 模型(约 1.5GB)。请等待“Ready”消息。

### 3. 添加到 OpenClaw 配置

将其添加到您的 `~/.openclaw/openclaw.json` 中:

```json { "tools": { "media": { "audio": { "enabled": true, "models": [ { "type": "cli", "command": "~/.openclaw/workspace/skills/local-whisper/scripts/transcribe.sh", "args": ["{{MediaPath}}"], "timeoutSeconds": 60 } ] } } } } ```

### 4. 重启网关 ```bash openclaw gateway restart ```

现在来自 Telegram、WhatsApp 等的语音消息将在本地免费转录!

### 手动测试 ```bash ./scripts/transcribe.sh voice_message.ogg ```

## 使用场景:Telegram 语音消息

无需支付 OpenAI API 费用来转录传入的语音消息,将 OpenClaw 指向此本地守护进程即可。永久免费转录。

## 登录时自动启动

```bash cp com.local-whisper.plist ~/Library/LaunchAgents/ launchctl load ~/Library/LaunchAgents/com.local-whisper.plist ```

## API

守护进程运行在 `localhost:8787`:

```bash curl -X POST http://localhost:8787/transcribe -F "[email protected]" # {"text": "Hello world", "language": "en"} ```

## 翻译

任何语言 → 英语:

```bash ./scripts/transcribe.sh spanish_audio.ogg --translate ```

## 系统要求

- 搭载 Apple Silicon 芯片的 macOS (M1/M2/M3/M4) - Python 3.9+

## 许可证

MIT

更多产品