ClawSkills logoClawSkills

Mlx Whisper

使用 MLX Whisper 进行本地语音转文本(针对 Apple Silicon 优化,无需 API 密钥)。

介绍

# MLX Whisper

使用 Apple MLX 的本地语音转文字功能,专为 Apple Silicon Mac 优化。

## 快速开始

```bash mlx_whisper /path/to/audio.mp3 --model mlx-community/whisper-large-v3-turbo ```

## 常见用法

```bash # Transcribe to text file mlx_whisper audio.m4a -f txt -o ./output

# Transcribe with language hint mlx_whisper audio.mp3 --language en --model mlx-community/whisper-large-v3-turbo

# Generate subtitles (SRT) mlx_whisper video.mp4 -f srt -o ./subs

# Translate to English mlx_whisper foreign.mp3 --task translate ```

## 模型(首次使用时自动下载)

| 模型 | 大小 | 速度 | 质量 | |-------|------|-------|---------| | mlx-community/whisper-tiny | ~75MB | 最快 | 基础 | | mlx-community/whisper-base | ~140MB | 快 | 良好 | | mlx-community/whisper-small | ~470MB | 中等 | 更好 | | mlx-community/whisper-medium | ~1.5GB | 较慢 | 优秀 | | mlx-community/whisper-large-v3 | ~3GB | 最慢 | 最佳 | | mlx-community/whisper-large-v3-turbo | ~1.6GB | 快 | 卓越(推荐) |

## 注意事项

- 需要配备 Apple Silicon 芯片的 Mac (M1/M2/M3/M4) - 模型缓存位置为 `~/.cache/huggingface/` - 默认模型为 `mlx-community/whisper-tiny`;使用 `--model mlx-community/whisper-large-v3-turbo` 可获得最佳效果

更多产品