关闭导航

包含标签"播客"的内容

Google发布Gemini2.5 TTS预览模型 全面替代旧版含情绪节奏多角色24语种
AI妹 6 个月前 19 0

Google发布Gemini2.5Flash与Pro文本转语音预览模型,全面替代今年5月旧版系统。新模型主打「情绪级」表达、上下文自适应节奏及24语种多角色对话,开发者现可在Google AI S

阿里Qwen3-TTS免费开放 49音色10语10方言WER领先
AI妹 6 个月前 19 0

阿里通义千问发布新一代语音合成大模型Qwen3-TTS,即日起通过Qwen API向全球开发者免费开放。模型提供49种多角色音色,支持10种主流语言及10种中国方言,官方称其在MiniMax TT

阿里Qwen3-TTS推出:零样本多角色跨语言,免费100万字符超商用模型
AI妹 6 个月前 22 0

阿里巴巴正式推出 Qwen3家族最新成员 Qwen3-TTS,主打“零样本、多角色、跨语言”语音合成。新模型在词错误率(WER)国际基准上显著优于主流商用引擎,同步上线阿里云控制台,开发者可0元调

微软发布小体积VibeVoice-0.5B 实时低延迟自然音质AI语音模型
AI妹 6 个月前 25 0

微软今日发布全新的实时文本转语音模型 VibeVoice-Realtime-0.5B。尽管模型规模仅为0.5B,但却具备接近实时的语音生成能力,最快可在约300毫秒内开始发声,实现“话未说完音已先

    1 2