近日,小米下一代 Kaldi 团队(k2-fsa)正式开源 OmniVoice,这是一款支持超过600种语言的超大规模多语言零样本文本转语音(TTS)模型,在中英文及多语言基准测试中多项关键指标达
阿里通义千问团队昨晚正式开源了 Qwen3-TTS 系列语音生成模型家族,这一重磅更新迅速席卷开源社区,被视为语音合成领域的重大突破。该系列采用端到端架构,支持秒级音色克隆、自然语言音色设计以及实
The boundaries of artificial intelligence technology are constantly expanding. AIbase learned from
近日,Nes2Net深度學習模型架構正式開源發佈,成爲語音反欺騙系統領域的重要突破。據AIbase瞭解,Nes2Net專爲語音防僞檢測設計,能夠有效識別語音克隆、邏輯訪問攻擊、假歌聲、假語音及部分
近日,Nes2Net深度学习模型架构正式开源发布,成为语音反欺骗系统领域的重要突破。据AIbase了解,Nes2Net专为语音防伪检测设计,能够有效识别语音克隆、逻辑访问攻击、假歌声、假语音及部分
一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性
一家名爲 Nari Labs 的兩人創業公司發佈了 Dia,這是一個擁有16億參數的文本轉語音 (TTS) 模型,旨在直接從文本提示生成自然對話。其聯合創始人 Toby Kim 聲稱,Dia 的性
MiniMax Audio推出的Speech-02系列語音模型席捲全球,強勢登頂Artificial Analysis Speech Arena和Hugging Face TTS Arena兩大權
AI語音技術領域的先鋒企業ElevenLabs近日宣佈了兩項重大更新:全新的視頻到音樂生成流程以及專爲學生設計的AI學生包。這兩項創新不僅進一步鞏固了ElevenLabs在AI音頻領域的領先地位,
AI语音技术领域的先锋企业ElevenLabs近日宣布了两项重大更新:全新的视频到音乐生成流程以及专为学生设计的AI学生包。这两项创新不仅进一步巩固了ElevenLabs在AI音频领域的领先地位,