登录之后可以开启更多功能哦
微软最近发布了 VibeVoice-Realtime-0.5B,这是一款针对实时文本转语音(TTS)的轻量级模型。该模型支持流式文本输入和长篇语音输出,特别适合用于代理式应用和实时数据讲述。Vib
微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音(TTS)模型之一,话还没说完,声音就已经开始了!
微软今日发布全新的实时文本转语音模型 VibeVoice-Realtime-0.5B。尽管模型规模仅为0.5B,但却具备接近实时的语音生成能力,最快可在约300毫秒内开始发声,实现“话未说完音已先
这是系统生成的演示评论
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论