关闭导航

包含标签"播客"的内容

谷歌Gemini-TTS文字转语音模型:富表现力可控覆盖多语种
AI妹 14 分钟前 0 0

谷歌近日在Gemini3.1系列中正式推出全新文字转语音模型Gemini-TTS,官方给出的定位直接而自信:"至今最富表现力的文本转语音解决方案"。 这款模型最核心的突破,在于把语音的"控制权"

LPM1.0模型发布 实时生成多模态交互人物视频促AI交互新升级
AI妹 2 天前 1 0

近日,研究人员正式发布LPM1.0模型,该研究项目旨在通过单张参考图像实时生成涵盖说话、聆听及唱歌行为的人物视频。LPM1.0的核心突破在于其多模态处理能力,能同步整合文本、音频与图像输入,生成具

Perplexity推出iOS AI语音助手 多功能助力用户高效生活工作
AI妹 3 个月前 15 0

近日,AI 技術公司 Perplexity 在官方渠道上宣佈推出一款全新的 AI 語音助手,專爲 iOS 平臺用戶設計。這款助手旨在爲用戶提供與蘋果原生的 Siri 相似的使用體驗,力求在生活和工

Spotify借生成型AI强化用户互动体验 加速产品开发与内部效率提升
AI妹 3 个月前 16 0

最近の財務電話会議で、Spotifyの最高製品・技術責任者であるグスタフ・ソデルストロム氏は、人工知能技術の進展に伴い、今後のSpotifyのユーザー体験がより「インタラクティブ」になるだろうと明

FlowSpeech语音合成技术新突破 自然流畅解决差异多场景适用开启新可能
AI妹 3 个月前 12 0

Artificial intelligence speech synthesis technology has made a new breakthrough. A text-to-speech

ElevenLabs推出SB-1無限音效板 文本生成音效革新多領域創作
AI妹 3 个月前 14 0

人工智能音頻領域的領軍企業ElevenLabs再次掀起行業波瀾,於今日正式推出一款基於 AI 的可定製音效控制面板工具——SB-1Infinite Soundboard。 用戶可以通過點

ElevenLabs推出SB-1 AI音效工具 赋能多场景创作受创作者热捧
AI妹 3 个月前 15 0

人工智能音频领域的领军企业ElevenLabs再次掀起行业波澜,于今日正式推出一款基于 AI 的可定制音效控制面板工具——SB-1Infinite Soundboard。 用户可以通过点

MiniMax Speech-02双榜登顶 零样本克隆多语言引领语音新生态
AI妹 3 个月前 15 0

MiniMax Audio推出的Speech-02系列语音模型席卷全球,强势登顶Artificial Analysis Speech Arena和Hugging Face TTS Arena两大权

Google发布Gemini2.5 TTS预览模型 全面替代旧版含情绪节奏多角色24语种
AI妹 4 个月前 16 0

Google发布Gemini2.5Flash与Pro文本转语音预览模型,全面替代今年5月旧版系统。新模型主打「情绪级」表达、上下文自适应节奏及24语种多角色对话,开发者现可在Google AI S

阿里Qwen3-TTS免费开放 49音色10语10方言WER领先
AI妹 4 个月前 16 0

阿里通义千问发布新一代语音合成大模型Qwen3-TTS,即日起通过Qwen API向全球开发者免费开放。模型提供49种多角色音色,支持10种主流语言及10种中国方言,官方称其在MiniMax TT

    1 2