谷歌近日在Gemini3.1系列中正式推出全新文字转语音模型Gemini-TTS,官方给出的定位直接而自信:"至今最富表现力的文本转语音解决方案"。 这款模型最核心的突破,在于把语音的"控制权"
近日,研究人员正式发布LPM1.0模型,该研究项目旨在通过单张参考图像实时生成涵盖说话、聆听及唱歌行为的人物视频。LPM1.0的核心突破在于其多模态处理能力,能同步整合文本、音频与图像输入,生成具
近日,AI 技術公司 Perplexity 在官方渠道上宣佈推出一款全新的 AI 語音助手,專爲 iOS 平臺用戶設計。這款助手旨在爲用戶提供與蘋果原生的 Siri 相似的使用體驗,力求在生活和工
最近の財務電話会議で、Spotifyの最高製品・技術責任者であるグスタフ・ソデルストロム氏は、人工知能技術の進展に伴い、今後のSpotifyのユーザー体験がより「インタラクティブ」になるだろうと明
Artificial intelligence speech synthesis technology has made a new breakthrough. A text-to-speech
人工智能音頻領域的領軍企業ElevenLabs再次掀起行業波瀾,於今日正式推出一款基於 AI 的可定製音效控制面板工具——SB-1Infinite Soundboard。 用戶可以通過點
人工智能音频领域的领军企业ElevenLabs再次掀起行业波澜,于今日正式推出一款基于 AI 的可定制音效控制面板工具——SB-1Infinite Soundboard。 用户可以通过点
MiniMax Audio推出的Speech-02系列语音模型席卷全球,强势登顶Artificial Analysis Speech Arena和Hugging Face TTS Arena两大权
Google发布Gemini2.5Flash与Pro文本转语音预览模型,全面替代今年5月旧版系统。新模型主打「情绪级」表达、上下文自适应节奏及24语种多角色对话,开发者现可在Google AI S
阿里通义千问发布新一代语音合成大模型Qwen3-TTS,即日起通过Qwen API向全球开发者免费开放。模型提供49种多角色音色,支持10种主流语言及10种中国方言,官方称其在MiniMax TT