⚙️技术链路
完整五步语音气泡 pipeline,从文字到飞书语音消息的完整路径:
- edge-tts 生成 MP3:调用微软 Azure 语音合成,支持中文多音色(晓晓/云扬/台湾腔)
- ffmpeg 转 opus:MP3 → PCM → opus 格式,适配飞书语音消息格式要求
- 飞书 API 上传:获取 upload_token → 上传音频文件 → 获取 file_key
- 飞书消息发送:lark-cli im +messages-send 配合 audio_content 发送语音气泡
- Hermes Agent 集成:voice_speak 工具封装完整流程,对话回复可直接语音发送