语音克隆 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"语音克隆"的内容

小米k2-fsa开源OmniVoice超600语言零样本TTS 多指标SOTA支持克隆与极速推理

小米k2-fsa开源OmniVoice超600语言零样本TTS 多指标SOTA支持克隆与极速推理

AI妹 2 个月前 3 0

近日，小米下一代 Kaldi 团队（k2-fsa）正式开源 OmniVoice，这是一款支持超过600种语言的超大规模多语言零样本文本转语音(TTS)模型，在中英文及多语言基准测试中多项关键指标达

多语言基准测试 RTF 0.025 非语言符号处理 GitHub 中文WER 0.84%

查看详情

阿里通义千问开源Qwen3-TTS：极速克隆低延迟自然语言可设计音色

阿里通义千问开源Qwen3-TTS：极速克隆低延迟自然语言可设计音色

AI妹 4 个月前 11 0

阿里通义千问团队昨晚正式开源了 Qwen3-TTS 系列语音生成模型家族，这一重磅更新迅速席卷开源社区，被视为语音合成领域的重大突破。该系列采用端到端架构，支持秒级音色克隆、自然语言音色设计以及实

端到端架构低延迟 Dual-Track双轨架构阿里通义千问语音克隆

查看详情

MiniMax MCP Server发布多模态AI工具赋能创作生态新发展

MiniMax MCP Server发布多模态AI工具赋能创作生态新发展

AI妹 5 个月前 20 0

The boundaries of artificial intelligence technology are constantly expanding. AIbase learned from

视频生成 Cursor MCP协议 T2A-01-HD模型 Runway

查看详情

Nes2Net语音反欺骗模型开源嵌套架构实现高效精准检测

Nes2Net语音反欺骗模型开源嵌套架构实现高效精准检测

AI妹 5 个月前 18 0

近日，Nes2Net深度學習模型架構正式開源發佈，成爲語音反欺騙系統領域的重要突破。據AIbase瞭解，Nes2Net專爲語音防僞檢測設計，能夠有效識別語音克隆、邏輯訪問攻擊、假歌聲、假語音及部分

MCP协议假歌声 CtrSVDD数据集 Shengshu Technology 物联网安全

查看详情

Nes2Net语音反欺骗模型开源嵌套架构实现轻量化高效检测

Nes2Net语音反欺骗模型开源嵌套架构实现轻量化高效检测

AI妹 5 个月前 16 0

近日，Nes2Net深度学习模型架构正式开源发布，成为语音反欺骗系统领域的重要突破。据AIbase了解，Nes2Net专为语音防伪检测设计，能够有效识别语音克隆、逻辑访问攻击、假歌声、假语音及部分

学术研究 ASVspoof2021 多尺度特征提取 Nested Res2Net架构高维特征处理

查看详情

两人创业公司Nari Labs发布开源TTS模型Dia 性能优于ElevenLabs等竞品

两人创业公司Nari Labs发布开源TTS模型Dia 性能优于ElevenLabs等竞品

AI妹 5 个月前 19 0

一家名为 Nari Labs 的两人创业公司发布了 Dia，这是一个拥有16亿参数的文本转语音（TTS）模型，旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称，Dia 的性

ElevenLabs CUDA12.6 PyTorch2.0+ 语音克隆 Hugging Face Space

查看详情

创业公司Nari Labs发布开源TTS模型Dia 性能优于多款同类产品

创业公司Nari Labs发布开源TTS模型Dia 性能优于多款同类产品

AI妹 5 个月前 16 0

一家名爲 Nari Labs 的兩人創業公司發佈了 Dia，這是一個擁有16億參數的文本轉語音（TTS）模型，旨在直接從文本提示生成自然對話。其聯合創始人 Toby Kim 聲稱，Dia 的性

Nari Labs 情绪语调 ElevenLabs Hugging Face ZeroGPU资助计划 Sesame CSM-1B

查看详情

国产MiniMax Speech-02双榜夺冠技术突破重塑AI语音应用生态

国产MiniMax Speech-02双榜夺冠技术突破重塑AI语音应用生态

AI妹 5 个月前 19 0

MiniMax Audio推出的Speech-02系列語音模型席捲全球，強勢登頂Artificial Analysis Speech Arena和Hugging Face TTS Arena兩大權

Speech-02系列高保真语音实时语音应用实时翻译 AI语音技术

查看详情

ElevenLabs发布视频转音乐流程与AI学生包赋能创作者及学生群体

ElevenLabs发布视频转音乐流程与AI学生包赋能创作者及学生群体

AI妹 5 个月前 15 0

AI語音技術領域的先鋒企業ElevenLabs近日宣佈了兩項重大更新:全新的視頻到音樂生成流程以及專爲學生設計的AI學生包。這兩項創新不僅進一步鞏固了ElevenLabs在AI音頻領域的領先地位，

游戏开发创意产业多模態创作 AI语音技术 AI音频领域

查看详情

ElevenLabs发布视频到音乐生成流程与AI学生包赋能创作与教育

ElevenLabs发布视频到音乐生成流程与AI学生包赋能创作与教育

AI妹 5 个月前 15 0

AI语音技术领域的先锋企业ElevenLabs近日宣布了两项重大更新:全新的视频到音乐生成流程以及专为学生设计的AI学生包。这两项创新不仅进一步巩固了ElevenLabs在AI音频领域的领先地位，

游戏开发 AI音频生态教育培训 SOC2合规多模态能力

查看详情

1



资讯姬

文章数量13527

总阅读量227.547k

总评论量0

会员数量2

本站由emlog驱动