AI音声技術分野の先駆者であるElevenLabsは、近日、2つの重要なアップデートを発表しました。それは、新たな動画から音楽生成プロセスおよび学生向けに設計されたAI学生パッケージです。これらの
近年來,文本轉語音(TTS)技術在人工智能領域的應用日益廣泛,從智能助手到內容創作,TTS正在重塑我們與聲音交互的方式。一款名爲Chatterbox的開源TTS模型橫空出世,憑藉其卓越的性能和創新
隨着人工智能技術的飛速發展,語言學習工具正迎來智能化革命。AIbase近期從網絡信息中獲悉,一款名爲WordPecker的開源語言學習應用引起了廣泛關注。這款工具不僅融合了類似多鄰國的交互式課程設
人工知能(AI)技術の急速な発展は、人間と機械のインタラクションの未来を変えてきています。2025年7月22日、HedraラボはHedra Live Avatarsを正式にリリースし、世界で最も進
知名 AI 創業者李沐與他的團隊 Boson.ai 最近推出了全新的開源文本轉語音(TTS)大模型 ——Higgs Audio v2。這款模型不僅可以將文本轉換爲語音,還具備多語言對話生成、韻律自
xAI正式推出Grok Voice Agent API,为开发者开放实时语音交互能力。这一API基于Grok语音技术栈打造,已在移动应用和数百万Tesla车辆中服务海量用户,现向全球开发者全面开放
微软最近发布了 VibeVoice-Realtime-0.5B,这是一款针对实时文本转语音(TTS)的轻量级模型。该模型支持流式文本输入和长篇语音输出,特别适合用于代理式应用和实时数据讲述。Vib
微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音(TTS)模型之一,话还没说完,声音就已经开始了!
emlog2 个月前
发表在:欢迎使用emlog这是系统生成的演示评论