关闭导航

包含标签"情绪表达"的内容

通义实验室开源Fun-CineForge影视级多场景配音多模态大模型
AI妹 1 个月前 2 0

传统的 AI 配音在面对影视、动画等高标准场景时,常因难以匹配复杂的情绪爆发和精准口型而遭遇瓶颈。针对这一痛点,通义实验室正式发布并开源了首个影视级多场景配音多模态大模型——

即夢ビデオ3.0新たにクローズドベータ開始 高品質能力進化で業界震撼
AI妹 3 个月前 16 0

昨日夜、即夢ビデオ3.0モデルのクローズドベータテストが開始されました。新しいビデオモデルは、映像がよりスムーズになり、以前のモデルと比べてプロンプトの忠実度も向上しています。 公式から公開され

微软开源黑马级VibeVoice实时TTS:低延迟多角色轻量高效接近商用
AI妹 4 个月前 23 0

微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音(TTS)模型之一,话还没说完,声音就已经开始了!