关闭导航

包含标签"TTS"的内容

ElevenLabs发布视频生成音乐功能与AI学生套餐两大重要更新
AI妹 1 个月前 10 0

AI音声技術分野の先駆者であるElevenLabsは、近日、2つの重要なアップデートを発表しました。それは、新たな動画から音楽生成プロセスおよび学生向けに設計されたAI学生パッケージです。これらの

Chatterbox开源TTS模型:革命性突破及零样本克隆等创新功能亮点
AI妹 1 个月前 10 0

近年來,文本轉語音(TTS)技術在人工智能領域的應用日益廣泛,從智能助手到內容創作,TTS正在重塑我們與聲音交互的方式。一款名爲Chatterbox的開源TTS模型橫空出世,憑藉其卓越的性能和創新

开源语言学习工具WordPecker:AI赋能个性化学习与沉浸式语音交互体验
AI妹 1 个月前 9 0

隨着人工智能技術的飛速發展,語言學習工具正迎來智能化革命。AIbase近期從網絡信息中獲悉,一款名爲WordPecker的開源語言學習應用引起了廣泛關注。這款工具不僅融合了類似多鄰國的交互式課程設

Hedra Live Avatars登场 低コスト低延迟开启AI动画多场景新篇章
AI妹 1 个月前 9 0

人工知能(AI)技術の急速な発展は、人間と機械のインタラクションの未来を変えてきています。2025年7月22日、HedraラボはHedra Live Avatarsを正式にリリースし、世界で最も進

李沐团队Boson.ai推出开源TTS大模型Higgs Audio v2 多功能突破成行业标杆
AI妹 1 个月前 9 0

知名 AI 創業者李沐與他的團隊 Boson.ai 最近推出了全新的開源文本轉語音(TTS)大模型 ——Higgs Audio v2。這款模型不僅可以將文本轉換爲語音,還具備多語言對話生成、韻律自

xAI正式推出Grok Voice Agent API 开放高性价比实时语音交互能力
AI妹 1 个月前 14 0

xAI正式推出Grok Voice Agent API,为开发者开放实时语音交互能力。这一API基于Grok语音技术栈打造,已在移动应用和数百万Tesla车辆中服务海量用户,现向全球开发者全面开放

微软发布VibeVoice-Realtime-0.5B 低延迟实时流式文本转语音模型
AI妹 1 个月前 17 0

微软最近发布了 VibeVoice-Realtime-0.5B,这是一款针对实时文本转语音(TTS)的轻量级模型。该模型支持流式文本输入和长篇语音输出,特别适合用于代理式应用和实时数据讲述。Vib

微软开源黑马级VibeVoice实时TTS:低延迟多角色轻量高效接近商用
AI妹 1 个月前 17 0

微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音(TTS)模型之一,话还没说完,声音就已经开始了!

    1 2