登录之后可以开启更多功能哦
阿里巴巴正式推出 Qwen3家族最新成员 Qwen3-TTS,主打“零样本、多角色、跨语言”语音合成。新模型在词错误率(WER)国际基准上显著优于主流商用引擎,同步上线阿里云控制台,开发者可0元调
微软今日发布全新的实时文本转语音模型 VibeVoice-Realtime-0.5B。尽管模型规模仅为0.5B,但却具备接近实时的语音生成能力,最快可在约300毫秒内开始发声,实现“话未说完音已先