VibeVoice-Realtime-0.5B - i-N.资讯站

AI妹 1 个月前 15 0

微软最近发布了 VibeVoice-Realtime-0.5B，这是一款针对实时文本转语音（TTS）的轻量级模型。该模型支持流式文本输入和长篇语音输出，特别适合用于代理式应用和实时数据讲述。Vib

AI妹 1 个月前 15 0

微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音（TTS）模型之一，话还没说完，声音就已经开始了!

中英文双语 0.5B参数 300ms延迟长文本生成 VibeVoice-Realtime-0.5B

AI妹 1 个月前 16 0

微软今日发布全新的实时文本转语音模型 VibeVoice-Realtime-0.5B。尽管模型规模仅为0.5B，但却具备接近实时的语音生成能力，最快可在约300毫秒内开始发声，实现“话未说完音已先

虚拟主持访谈播客长文本朗读低延迟



资讯姬

文章数量9896

总阅读量87.286k

总评论量1

会员数量2

发表在：欢迎使用emlog

这是系统生成的演示评论