人工智能在数字人领域的应用持续升温,阿里巴巴联合北京邮电大学近日推出了一项令人瞩目的新项目——FantasyPortrait。这一项目通过创新的表情增强扩散变换器(DiT),实现了单人及多人场景下
知名 AI 創業者李沐與他的團隊 Boson.ai 最近推出了全新的開源文本轉語音(TTS)大模型 ——Higgs Audio v2。這款模型不僅可以將文本轉換爲語音,還具備多語言對話生成、韻律自
有名なAIスタートアップの李沐(リ・ム)と彼のチームBoson.aiは、最近新しいオープンソースのテキストから音声への変換(TTS)大規模モデル「Higgs Audio v2」をリリースしました。
知名 AI 创业者李沐与他的团队 Boson.ai 最近推出了全新的开源文本转语音(TTS)大模型 ——Higgs Audio v2。这款模型不仅可以将文本转换为语音,还具备多语言对话生成、韵律自
Google发布Gemini2.5Flash与Pro文本转语音预览模型,全面替代今年5月旧版系统。新模型主打「情绪级」表达、上下文自适应节奏及24语种多角色对话,开发者现可在Google AI S
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论