ClawSkills logoClawSkills

MLX STT

使用 MLX (Apple Silicon) 和开源模型(默认为 GLM-ASR-Nano-2512)在本地进行语音转文字。

介绍

# MLX STT

使用 MLX(Apple Silicon)和开源模型(默认为 GLM-ASR-Nano-2512)在本地进行语音转文字/ASR/转录。

免费且准确。无需 API 密钥。无需服务器。

## Requirements(要求)

- `mlx`:搭载 Apple Silicon 的 macOS - `brew`:用于在缺少依赖时进行安装

## Installation(安装)

```bash bash ${baseDir}/install.sh ```

如果缺少以下命令行工具,该脚本将使用 `brew` 进行安装: - `ffmpeg`:在需要时转换音频格式 - `uv`:安装 Python 包并运行 Python 脚本 - `mlx_audio`:执行实际任务

## Usage(用法)

要转录音频文件,请运行此脚本:

```bash bash ${baseDir}/mlx-stt.sh <audio_file_path> ```

- 首次运行可能会稍慢,因为需要下载模型。 - 转录结果将打印到标准输出(stdout)。

更多产品