关闭导航

包含标签"VibeVoice-Realtime-0.5B"的内容

微软发布VibeVoice-Realtime-0.5B 低延迟实时流式文本转语音模型
AI妹 1 个月前 15 0

微软最近发布了 VibeVoice-Realtime-0.5B,这是一款针对实时文本转语音(TTS)的轻量级模型。该模型支持流式文本输入和长篇语音输出,特别适合用于代理式应用和实时数据讲述。Vib

微软开源黑马级VibeVoice实时TTS:低延迟多角色轻量高效接近商用
AI妹 1 个月前 15 0

微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音(TTS)模型之一,话还没说完,声音就已经开始了!

微软发布小体积VibeVoice-0.5B 实时低延迟自然音质AI语音模型
AI妹 1 个月前 16 0

微软今日发布全新的实时文本转语音模型 VibeVoice-Realtime-0.5B。尽管模型规模仅为0.5B,但却具备接近实时的语音生成能力,最快可在约300毫秒内开始发声,实现“话未说完音已先