关闭导航

包含标签"语音克隆"的内容

小米k2-fsa开源OmniVoice超600语言零样本TTS 多指标SOTA支持克隆与极速推理
AI妹 6 天前 1 0

近日,小米下一代 Kaldi 团队(k2-fsa)正式开源 OmniVoice,这是一款支持超过600种语言的超大规模多语言零样本文本转语音(TTS)模型,在中英文及多语言基准测试中多项关键指标达

阿里通义千问开源Qwen3-TTS:极速克隆低延迟 自然语言可设计音色
AI妹 2 个月前 8 0

阿里通义千问团队昨晚正式开源了 Qwen3-TTS 系列语音生成模型家族,这一重磅更新迅速席卷开源社区,被视为语音合成领域的重大突破。该系列采用端到端架构,支持秒级音色克隆、自然语言音色设计以及实

MiniMax MCP Server发布 多模态AI工具赋能创作生态新发展
AI妹 3 个月前 16 0

The boundaries of artificial intelligence technology are constantly expanding. AIbase learned from

Nes2Net语音反欺骗模型开源 嵌套架构实现高效精准检测
AI妹 3 个月前 15 0

近日,Nes2Net深度學習模型架構正式開源發佈,成爲語音反欺騙系統領域的重要突破。據AIbase瞭解,Nes2Net專爲語音防僞檢測設計,能夠有效識別語音克隆、邏輯訪問攻擊、假歌聲、假語音及部分

Nes2Net语音反欺骗模型开源 嵌套架构实现轻量化高效检测
AI妹 3 个月前 13 0

近日,Nes2Net深度学习模型架构正式开源发布,成为语音反欺骗系统领域的重要突破。据AIbase了解,Nes2Net专为语音防伪检测设计,能够有效识别语音克隆、逻辑访问攻击、假歌声、假语音及部分

两人创业公司Nari Labs发布开源TTS模型Dia 性能优于ElevenLabs等竞品
AI妹 3 个月前 15 0

一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性

创业公司Nari Labs发布开源TTS模型Dia 性能优于多款同类产品
AI妹 3 个月前 13 0

一家名爲 Nari Labs 的兩人創業公司發佈了 Dia,這是一個擁有16億參數的文本轉語音 (TTS) 模型,旨在直接從文本提示生成自然對話。其聯合創始人 Toby Kim 聲稱,Dia 的性

国产MiniMax Speech-02双榜夺冠 技术突破重塑AI语音应用生态
AI妹 3 个月前 14 0

MiniMax Audio推出的Speech-02系列語音模型席捲全球,強勢登頂Artificial Analysis Speech Arena和Hugging Face TTS Arena兩大權

ElevenLabs发布视频转音乐流程与AI学生包 赋能创作者及学生群体
AI妹 3 个月前 12 0

AI語音技術領域的先鋒企業ElevenLabs近日宣佈了兩項重大更新:全新的視頻到音樂生成流程以及專爲學生設計的AI學生包。這兩項創新不僅進一步鞏固了ElevenLabs在AI音頻領域的領先地位,

ElevenLabs发布视频到音乐生成流程与AI学生包 赋能创作与教育
AI妹 3 个月前 13 0

AI语音技术领域的先锋企业ElevenLabs近日宣布了两项重大更新:全新的视频到音乐生成流程以及专为学生设计的AI学生包。这两项创新不仅进一步巩固了ElevenLabs在AI音频领域的领先地位,

    1 2