ClawSkills logoClawSkills

DeepGram Speech platform

命令行工具,利用 Deepgram 的 API 并提供可自定义选项,从本地文件、URL 或实时音频进行快速、准确的语音转文字转录。

介绍

# Deepgram CLI Skills Guide

## 工具 **@deepgram/cli** — Deepgram 语音转文本的命令行接口。

---

## 安装 ```bash npm install -g @deepgram/cli ```

---

## 认证

```bash deepgram login ```

使用您的 Deepgram API 密钥(存储在本地)。

---

## 核心技能:语音 → 文本

### 转录本地音频文件

```bash deepgram listen prerecorded audio.wav ```

### 带选项转录

```bash deepgram listen prerecorded audio.wav \ --model nova-2 \ --language en \ --punctuate \ --diarize ```

---

## 核心技能:读取/获取内容

### 从 URL(远程音频)

```bash deepgram listen prerecorded https://example.com/audio.mp3 ```

### 从 STDIN(管道)

```bash cat audio.wav | deepgram listen prerecorded - ```

### 从麦克风(实时)

```bash deepgram listen microphone ```

使用 `Ctrl+C` 停止。恭喜,您刚刚听写了现实世界。

---

## 输出处理

### 保存转录文本

```bash deepgram listen prerecorded audio.wav > transcript.json ```

### 纯文本输出

```bash deepgram listen prerecorded audio.wav --format text ```

---

## 常用标志(记住这些)

* `--model` – `nova-2`, `general`, 等。 * `--language` – `en`, `tr`, `de`, … * `--punctuate` – 添加标点符号 * `--diarize` – 说话人分离 * `--format` – `json`, `text`, `srt`, `vtt`

---

## 典型工作流

1. 获取内容(文件 / URL / 麦克风) 2. 运行 `deepgram listen` 3. 捕获输出(JSON 或 文本) 4. 后处理(搜索、摘要、字幕)

---

## 技能总结

* 基于 CLI 的语音转文本 * 本地、远程和实时音频 * 可脚本化、管道友好 * 快速、准确、无 UI 累赘

Deepgram CLI:因为键盘被高估了。

更多产品