介绍
# MLX Whisper
使用 Apple MLX 的本地语音转文字功能,专为 Apple Silicon Mac 优化。
## 快速开始
```bash mlx_whisper /path/to/audio.mp3 --model mlx-community/whisper-large-v3-turbo ```
## 常见用法
```bash # Transcribe to text file mlx_whisper audio.m4a -f txt -o ./output
# Transcribe with language hint mlx_whisper audio.mp3 --language en --model mlx-community/whisper-large-v3-turbo
# Generate subtitles (SRT) mlx_whisper video.mp4 -f srt -o ./subs
# Translate to English mlx_whisper foreign.mp3 --task translate ```
## 模型(首次使用时自动下载)
| 模型 | 大小 | 速度 | 质量 | |-------|------|-------|---------| | mlx-community/whisper-tiny | ~75MB | 最快 | 基础 | | mlx-community/whisper-base | ~140MB | 快 | 良好 | | mlx-community/whisper-small | ~470MB | 中等 | 更好 | | mlx-community/whisper-medium | ~1.5GB | 较慢 | 优秀 | | mlx-community/whisper-large-v3 | ~3GB | 最慢 | 最佳 | | mlx-community/whisper-large-v3-turbo | ~1.6GB | 快 | 卓越(推荐) |
## 注意事项
- 需要配备 Apple Silicon 芯片的 Mac (M1/M2/M3/M4) - 模型缓存位置为 `~/.cache/huggingface/` - 默认模型为 `mlx-community/whisper-tiny`;使用 `--model mlx-community/whisper-large-v3-turbo` 可获得最佳效果