登录之后可以开启更多功能哦
微软近日开源了名为VibeVoice的前沿语音 AI 模型家族,涵盖自动语音识别(ASR)和文本转语音(TTS)等多项能力。该项目以其强大的长音频处理、多说话人自然对话生成以及实时低延迟特性,迅速
生成式 AI 在音频领域的进化,正从“短乐句”迈向“全曲创作”的深水区。 本周三, 谷歌 旗下 AI 实验室 DeepMind 正式推出了专注于