ClawSkills logoClawSkills

Elevenlabs

通过 ElevenLabs API 进行文本转语音、音效、音乐生成、语音管理和配额检查。使用 ElevenLabs 生成音频或管理

介绍

# ElevenLabs Skill

用于与 ElevenLabs API 进行交互以生成声音、音乐和管理语音的核心工具。

## 设置

请参阅 [SETUP.md](SETUP.md) 了解前提条件和设置说明。

## 模型

| 模型 | ID | 用例 | |-------|----|----------| | **Eleven v3** | `eleven_v3` | ⭐ 最适合表现力强/创意音频。支持**音频标签**(方括号):`[laughs]`、`[sighs]`、`[whispers]`、`[excited]`、`[grumpy voice]`、`[clears throat]` 等。适用于讲故事、角色扮演和演示。 | | Multilingual v2 | `eleven_multilingual_v2` | 稳定的多语言模型。不支持音频标签。适合直白的旁白。 | | Turbo v2.5 | `eleven_turbo_v2_5` | 低延迟,适合非英语(例如德语 TTS)。实时/对话场景所必需。 | | Flash v2.5 | `eleven_flash_v2_5` | 速度最快,成本最低。 |

### v3 音频标签(方括号,而非 XML/SSML) ``` [laughs], [chuckles], [sighs], [clears throat], [whispers], [shouts] [excited], [sad], [angry], [warmly], [deadpan], [sarcastic] [grumpy voice], [philosophical], [whiny voice], [resigned] [laughs hard], [sighs deeply], [pause] ``` 标签可以放在文本中的任何位置。可自由组合使用。v3 能深度理解情感语境。

## 输出格式

所有脚本均支持通过 `--format` 参数选择多种输出格式:

| 格式 | 描述 | |--------|-------------| | `mp3_44100_128` | MP3, 44.1kHz, 128kbps (默认) | | `mp3_44100_192` | MP3, 44.1kHz, 192kbps | | `mp3_44100_96` | MP3, 44.1kHz, 96kbps | | `mp3_44100_64` | MP3, 44.1kHz, 64kbps | | `mp3_44100_32` | MP3, 44.1kHz, 32kbps | | `mp3_24000_48` | MP3, 24kHz, 48kbps | | `mp3_22050_32` | MP3, 22.05kHz, 32kbps | | `opus_48000_192` | Opus, 48kHz, 192kbps ⭐ 最适合 AirPlay | | `opus_48000_128` | Opus, 48kHz, 128kbps | | `opus_48000_96` | Opus, 48kHz, 96kbps | | `opus_48000_64` | Opus, 48kHz, 64kbps | | `opus_48000_32` | Opus, 48kHz, 32kbps | | `pcm_16000` | Raw PCM, 16kHz | | `pcm_22050` | Raw PCM, 22.05kHz | | `pcm_24000` | Raw PCM, 24kHz | | `alaw_8000` | A-law, 8kHz (电话) |

## 工具

### 1. 语音合成 (`speech.py`) 使用 ElevenLabs 语音进行文本转语音。

```bash # Basic usage python3 {baseDir}/scripts/speech.py "Hello world" -v <voice_id> -o output.mp3

# With format option python3 {baseDir}/scripts/speech.py "Hello world" -v <voice_id> -o output.pcm --format pcm_44100

# With voice settings python3 {baseDir}/scripts/speech.py "Hello" -v <voice_id> -o out.mp3 --stability 0.7 --similarity 0.8 ```

### 2. 音效 (`sfx.py`) 生成音效和简短的音频片段。

```bash # Generate a sound python3 {baseDir}/scripts/sfx.py "Cinematic boom" -o boom.mp3

# Generate a loop python3 {baseDir}/scripts/sfx.py "Lo-fi hip hop beat" --duration 10 --loop -o beat.mp3

# Different format python3 {baseDir}/scripts/sfx.py "Whoosh" -o whoosh.pcm --format pcm_44100 ```

### 3. 音乐生成 (`music.py`) 生成完整的音乐作品或器乐曲目。

```bash # Generate instrumental intro python3 {baseDir}/scripts/music.py --prompt "Upbeat 6s news intro sting, instrumental" --length-ms 6000 -o intro.mp3

# Generate background bed python3 {baseDir}/scripts/music.py --prompt "Soft ambient synth pad" --length-ms 30000 -o bed.mp3

# High quality MP3 python3 {baseDir}/scripts/music.py --prompt "Jazz piano" --length-ms 10000 -o jazz.mp3 --output-format mp3_44100_192 ```

### 4. 语音 (`voices.py`) 列出可用语音及其 ID。

```bash # List voices python3 {baseDir}/scripts/voices.py

# JSON output python3 {baseDir}/scripts/voices.py --json ```

### 5. 语音克隆 (`voiceclone.py`) 从音频样本创建即时语音克隆。

**安全性:** 默认情况下,此脚本仅会读取以下目录中的文件: - `~/.openclaw/elevenlabs/voiceclone-samples/`

请将您的样本复制到该目录(或传递 `--sample-dir` 参数)。禁止读取示例目录之外的文件。

```bash # Clone from audio files (put samples into ~/.openclaw/elevenlabs/voiceclone-samples) python3 {baseDir}/scripts/voiceclone.py --name "MyVoice" --files sample1.mp3 sample2.mp3

# Use a custom sample dir python3 {baseDir}/scripts/voiceclone.py --name "Andi" --sample-dir ./samples --files a.m4a b.m4a --language de --gender male

# With description and noise removal python3 {baseDir}/scripts/voiceclone.py --name "Andi" --files a.m4a b.m4a --description "German male" --denoise ```

### 6. 配额与用量 (`quota.py`) 检查订阅配额和使用统计数据。

```bash # Show current quota python3 {baseDir}/scripts/quota.py

# Include usage breakdown by voice python3 {baseDir}/scripts/quota.py --usage

# Last 7 days usage python3 {baseDir}/scripts/quota.py --usage --days 7

# JSON output python3 {baseDir}/scripts/quota.py --json ```

输出: ``` 📊 ElevenLabs Quota ======================================= Plan: pro (active) — annual Characters: 66.6K / 500.0K (13.3%) [███░░░░░░░░░░░░░░░░░░░░░░░░░░░] Resets: 2026-02-18 (29 days) Voices: 22 / 160 (IVC: ✓) Pro Voice: 0 / 1 (PVC: ✓) ```

更多产品