2026 年 5 月 28 日,全球权威 AI 评测平台 Artificial Analysis 发布了最新一期语音排行榜(Speech Arena)。阿里巴巴凭借语音大模型 Fun-Realti
在最新发布的全球权威TTS(语音合成)评测榜单Artificial Analysis Speech Arena Leaderboard中,来自中国的阶跃星辰(StepFun)展现出强劲实力。其语音
近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域
近日,英偉達在 Hugging Face 平臺上推出了其最新的自動語音識別(ASR)模型 ——Parakeet-TDT-0.6B-V2。這一新模型不僅在性能上有顯著提升,還將開源理念與商業應用相結
最近 AI 圈可是熱鬧非凡,今天咱們就來聊聊其中的 “狠角色”——LLaMA-Omni2。這是一系列超厲害的語音語言模型(SpeechLMs),參數規模從0.5B 到14B 不等,專門爲實現高質量