Tts

使用 Hume AI（或 OpenAI）API 将文本转换为语音。当用户要求发送音频消息、语音回复或希望“亲口”听到某些内容时使用。

介绍

# Text-to-Speech (TTS)

将文本转换为语音并生成音频文件 (MP3)。

## Hume AI (推荐)

- **推荐音色**: `9e1f9e4f-691a-4bb0-b87c-e306a4c838ef` - **密钥**: 存储在环境变量中，分别为 `HUME_API_KEY` 和 `HUME_SECRET_KEY`。

### 使用方法

```bash HUME_API_KEY="..." HUME_SECRET_KEY="..." node {baseDir}/scripts/generate_hume_speech.js --text "Hello Jonathan" --output "output.mp3" ```

## OpenAI (旧版)

- **推荐音色**: `nova` - **使用方法**: `OPENAI_API_KEY="..." node {baseDir}/scripts/generate_speech.js --text "..." --output "..."`

## 通用说明

- 脚本会打印一行 `MEDIA:`，其中包含生成文件的绝对路径。 - 使用 `message` 工具将生成的文件发送给用户。

使用 Nano Banana Pro (Gemini 3 Pro Image) 生成/编辑图像。用于图像创建/修改请求，包括编辑。支持文本生成图像 + 图像生成图像；1K/2K

用于单次问答、摘要和生成的 Gemini CLI。

577+ 种模式提示注入防御。现具备容错绕过检测功能。TieredPatternLoader 完全运行。适用于任何 LLM 应用程序的即插即用防御。