ClawSkills logoClawSkills

Walkie-Talkie Mode

处理 WhatsApp 上的语音对语音对话。自动转录传入的音频并使用本地 TTS 音频进行回复。当用户想要“交谈”时使用

介绍

# Walkie-Talkie Mode

此技能使用本地转录和本地 TTS 自动化 WhatsApp 上的语音对语音循环。

## 工作流程

1. **接收音频**:当用户发送 audio/ogg/opus 文件时: - 使用 `tools/transcribe_voice.sh` 获取文本。 - 将文本作为普通用户提示处理。

2. **发送回复**: - 使用 `bin/sherpa-onnx-tts` 生成语音,而不是文本回复。 - 将生成的 `.ogg` 文件作为语音笔记发送回用户。

## 触发条件

- 用户发送音频消息。 - 用户说“activa modo walkie-talkie”或“hablemos por voz”。

## 约束条件

- 仅使用本地工具(ffmpeg、whisper-cpp、sherpa-onnx-tts)。 - 保持快速响应时间(RTF < 0.5)。 - 始终同时回复文本(以便清晰明了)和音频。

## 手动执行(内部)

要手动通过语音回复: ```bash bin/sherpa-onnx-tts /tmp/reply.ogg "Tu mensaje aquí" ``` 然后通过 `message` 工具配合 `filePath` 发送 `/tmp/reply.ogg`。

更多产品