近日,阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型,旨在通过文本指令生成或克隆声音。其中,Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音,用户可以精确定义声
人工智能语音领域迎来强力竞争者,初创公司 Resemble AI 正式发布了名为“Chatterbox Turbo”的开源文本转语音模型,其矛头直指 ElevenLabs 和 Cartesia 等
全球AI语音领导者ElevenLabs于2025年12月18日宣布一项里程碑式更新:其AI语音智能体(Agents)正式深度集成WhatsApp,首次实现文字+语音双模全渠道交互——用户既可通过文
ロンドンに拠点を置くクリエイティブスタジオWonderが、300万ドルのシードラウンド資金調達に成功しました。リード投資家はLocalGlobe、その他オーストラリアのベンチャーキャピタルBlac
近日,位於倫敦的創意工作室 Wonder 宣佈成功獲得300萬美元的種子輪融資,融資由 LocalGlobe 領投,其他投資者包括澳大利亞風險投資公司 Blackbird、AI 語音初創公司 El
Nari Labsという2人組のスタートアップ企業が、16億パラメーターを持つテキスト音声変換(TTS)モデル「Dia」をリリースしました。テキストプロンプトから自然な会話を直接生成することを目指
一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性
一家名爲 Nari Labs 的兩人創業公司發佈了 Dia,這是一個擁有16億參數的文本轉語音 (TTS) 模型,旨在直接從文本提示生成自然對話。其聯合創始人 Toby Kim 聲稱,Dia 的性
A two-person startup called Nari Labs has released Dia, a 1.6-billion parameter text-to-speech (TT
Anthropic在其Claude移动应用程序的最新更新中新增了名为“Glassy”的语音选项,进一步推动其语音模式(Voice Mode)的开发进程。据AIbase了解,“Glassy”作为Cl
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论