ClawSkills logoClawSkills

Sag

ElevenLabs 文字转语音,具有 mac 风格的 say 用户体验。

介绍

# sag

使用 `sag` 配合 ElevenLabs TTS 进行本地播放。

API 密钥(必需) - `ELEVENLABS_API_KEY`(首选) - CLI 也支持 `SAG_API_KEY`

快速开始 - `sag "Hello there"` - `sag speak -v "Roger" "Hello"` - `sag voices` - `sag prompting`(模型特定提示)

模型说明 - 默认:`eleven_v3`(富有表现力) - 稳定:`eleven_multilingual_v2` - 快速:`eleven_flash_v2_5`

发音与表达规则 - 首选修正:重新拼写(如 "key-note"),添加连字符,调整大小写。 - 数字/单位/URL:`--normalize auto`(如果破坏了名称则使用 `off`)。 - 语言倾向:`--lang en|de|fr|...` 用于引导标准化。 - v3:不支持 SSML `<break>`;请使用 `[pause]`、`[short pause]`、`[long pause]`。 - v2/v2.5:支持 SSML `<break time="1.5s" />`;`sag` 中未公开 `<phoneme>`。

v3 音频标签(置于行首) - `[whispers]`、`[shouts]`、`[sings]` - `[laughs]`、`[starts laughing]`、`[sighs]`、`[exhales]` - `[sarcastic]`、`[curious]`、`[excited]`、`[crying]`、`[mischievously]` - 示例:`sag "[whispers] keep this quiet. [short pause] ok?"`

语音默认设置 - `ELEVENLABS_VOICE_ID` 或 `SAG_VOICE_ID`

在长输出前确认语音和说话人。

## 聊天语音回复

当 Peter 请求“语音”回复(例如“crazy scientist voice”、“explain in voice”)时,生成音频并发送:

```bash # Generate audio file sag -v Clawd -o /tmp/voice-reply.mp3 "Your message here"

# Then include in reply: # MEDIA:/tmp/voice-reply.mp3 ```

语音角色提示: - 疯狂科学家:使用 `[excited]` 标签,戏剧性停顿 `[short pause]`,改变强度 - 冷静:使用 `[whispers]` 或较慢的节奏 - 戏剧性:适度使用 `[sings]` 或 `[shouts]`

Clawd 的默认语音:`lj2rcrvANS3gaWWnczSX`(或直接使用 `-v Clawd`)

更多产品