歌声合成 - i-N.资讯站

AI妹 2 个月前 6 0

小米正式发布自研语音合成大模型Xiaomi MiMo-V2-TTS，标志着其在高度可控、高表现力语音生成领域取得重要进展。该模型基于自研Audio Tokenizer及多码本语音-文本联合建模架构

多语种覆盖 Audio Tokenizer 歌声合成高度可控高表现力语音生成方言

AI妹 6 个月前 27 0

巨人网络AI Lab 近日联合清华大学 SATLab、西北工业大学，重磅推出了三项音视频领域的多模态生成技术成果:音乐驱动的视频生成模型 YingVideo-MV、零样本歌声转换模型 YingMu

零样本歌声转换清华大学SATLab GitHub HuggingFace 音视频多模态生成技术



资讯姬

文章数量13547

总阅读量239.718k

总评论量0

会员数量2