TTS - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"TTS"的内容

MiniMax Speech-02登顶国际语音榜零样本克隆技术破局音频领域

MiniMax Speech-02登顶国际语音榜零样本克隆技术破局音频领域

AI妹 5 个月前 16 0

在人工智能領域的快速發展中，國產大模型的進步速度讓人驚歎。早在今年初，DeepSeek-R1以超低成本獲得了超越 OpenAI 的表現，令人重新審視國外大模型的壟斷地位。如今，MiniMax 再次

MiniMax T2V框架 ElevenLabs 字错率(WER) 零样本语音克隆

查看详情

FlowSpeech语音合成技术新突破自然流畅解决差异多场景适用开启新可能

FlowSpeech语音合成技术新突破自然流畅解决差异多场景适用开启新可能

AI妹 5 个月前 16 0

Artificial intelligence speech synthesis technology has made a new breakthrough. A text-to-speech

ListenHub 上下文感知人工智能语音合成技术文本转语音多模态支持

查看详情

ElevenLabs发布视频生成音乐功能与AI学生套餐两大重要更新

ElevenLabs发布视频生成音乐功能与AI学生套餐两大重要更新

AI妹 5 个月前 19 0

AI音声技術分野の先駆者であるElevenLabsは、近日、2つの重要なアップデートを発表しました。それは、新たな動画から音楽生成プロセスおよび学生向けに設計されたAI学生パッケージです。これらの

著作権 SOC2 学生支援教育分野 API

查看详情

Chatterbox开源TTS模型：革命性突破及零样本克隆等创新功能亮点

Chatterbox开源TTS模型：革命性突破及零样本克隆等创新功能亮点

AI妹 5 个月前 21 0

近年來，文本轉語音（TTS）技術在人工智能領域的應用日益廣泛，從智能助手到內容創作，TTS正在重塑我們與聲音交互的方式。一款名爲Chatterbox的開源TTS模型橫空出世，憑藉其卓越的性能和創新

MIT许可证文本转语音 LLaMA架构 Perth神经水印 AIbase

查看详情

开源语言学习工具WordPecker：AI赋能个性化学习与沉浸式语音交互体验

开源语言学习工具WordPecker：AI赋能个性化学习与沉浸式语音交互体验

AI妹 5 个月前 17 0

隨着人工智能技術的飛速發展，語言學習工具正迎來智能化革命。AIbase近期從網絡信息中獲悉，一款名爲WordPecker的開源語言學習應用引起了廣泛關注。這款工具不僅融合了類似多鄰國的交互式課程設

TTS 多样化学习模式 LLM 语音练习开源项目

查看详情

Hedra Live Avatars登场低コスト低延迟开启AI动画多场景新篇章

Hedra Live Avatars登场低コスト低延迟开启AI动画多场景新篇章

AI妹 5 个月前 16 0

人工知能（AI）技術の急速な発展は、人間と機械のインタラクションの未来を変えてきています。2025年7月22日、HedraラボはHedra Live Avatarsを正式にリリースし、世界で最も進

口唇同期カスタマーサービス倫理的問題高度な柔軟性リアルタイムインタラクション

查看详情

李沐团队Boson.ai推出开源TTS大模型Higgs Audio v2 多功能突破成行业标杆

李沐团队Boson.ai推出开源TTS大模型Higgs Audio v2 多功能突破成行业标杆

AI妹 5 个月前 14 0

知名 AI 創業者李沐與他的團隊 Boson.ai 最近推出了全新的開源文本轉語音（TTS）大模型 ——Higgs Audio v2。這款模型不僅可以將文本轉換爲語音，還具備多語言對話生成、韻律自

离散化音频分词器零样本语音克隆开源文本转语音大模型声音克隆多模态能力

查看详情

xAI正式推出Grok Voice Agent API 开放高性价比实时语音交互能力

xAI正式推出Grok Voice Agent API 开放高性价比实时语音交互能力

AI妹 5 个月前 22 0

xAI正式推出Grok Voice Agent API，为开发者开放实时语音交互能力。这一API基于Grok语音技术栈打造，已在移动应用和数百万Tesla车辆中服务海量用户，现向全球开发者全面开放

0.05美元每分钟 Rex Grok Voice Agent API TTS 实时双向语音通信

查看详情

微软发布VibeVoice-Realtime-0.5B 低延迟实时流式文本转语音模型

微软发布VibeVoice-Realtime-0.5B 低延迟实时流式文本转语音模型

AI妹 6 个月前 24 0

微软最近发布了 VibeVoice-Realtime-0.5B，这是一款针对实时文本转语音（TTS）的轻量级模型。该模型支持流式文本输入和长篇语音输出，特别适合用于代理式应用和实时数据讲述。Vib

交错窗口设计 VibeVoice-Realtime-0.5B 实时文本转语音对话LLM集成首音延迟300毫秒

查看详情

微软开源黑马级VibeVoice实时TTS：低延迟多角色轻量高效接近商用

微软开源黑马级VibeVoice实时TTS：低延迟多角色轻量高效接近商用

AI妹 6 个月前 27 0

微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音（TTS）模型之一，话还没说完，声音就已经开始了!

轻量级模型多角色对话 90分钟音频 GitHub 开源

查看详情

2



资讯姬

文章数量13546

总阅读量238.084k

总评论量0

会员数量2

本站由emlog驱动