ClawSkills logoClawSkills

Transcribe

使用本地 Whisper (Docker) 将音频文件转录为文本。在收到语音消息、音频文件(.mp3, .m4a, .ogg, .wav, .webm)或被要求进行 tr 时使用

介绍

# Transcribe

在 Docker 中使用 faster-whisper 进行本地音频转录。

## 安装

```bash cd /path/to/skills/transcribe/scripts chmod +x install.sh ./install.sh ```

这将构建 Docker 镜像 `whisper:local` 并安装 `transcribe` CLI。

## 用法

```bash transcribe /path/to/audio.mp3 [language] ```

- 默认语言:`es`(西班牙语) - 使用 `auto` 进行自动检测 - 输出纯文本到 stdout

## 示例

```bash transcribe /tmp/voice.ogg # Spanish (default) transcribe /tmp/meeting.mp3 en # English transcribe /tmp/audio.m4a auto # Auto-detect ```

## 支持的格式

mp3, m4a, ogg, wav, webm, flac, aac

## 当收到语音消息时

1. 将音频附件保存到临时文件 2. 运行 `transcribe <path>` 3. 在回复中包含转录内容 4. 清理临时文件

## 文件

- `scripts/transcribe` - CLI 封装脚本 (bash) - `scripts/install.sh` - 安装脚本(包含内联的 Dockerfile)

## 说明

- 模型:`small`(快速)——如需更高准确率,可编辑 install.sh 使用 `large-v3` - 完全本地运行,无需 API 密钥

更多产品