关闭导航

包含标签"多说话人"的内容

微软开源VibeVoice语音AI模型家族 含ASR/TTS支持长音频及本地部署
AI妹 16 天前 2 0

微软近日开源了名为VibeVoice的前沿语音 AI 模型家族,涵盖自动语音识别(ASR)和文本转语音(TTS)等多项能力。该项目以其强大的长音频处理、多说话人自然对话生成以及实时低延迟特性,迅速