关闭导航

包含标签"ASR"的内容

阿里语音大模型Fun-Realtime-TTS-Preview获全球第五国产第一 横扫三大核心语音赛道
AI妹 13 天前 1 0

2026 年 5 月 28 日,全球权威 AI 评测平台 Artificial Analysis 发布了最新一期语音排行榜(Speech Arena)。阿里巴巴凭借语音大模型 Fun-Realti

阶跃星辰StepAudio2.5TTS全球前三 语音技术量产上车
AI妹 1 个月前 1 0

在最新发布的全球权威TTS(语音合成)评测榜单Artificial Analysis Speech Arena Leaderboard中,来自中国的阶跃星辰(StepFun)展现出强劲实力。其语音

清华NLP实验室等联合发布UltraEval-Audio v1.1.0开源框架推动音频模型发展
AI妹 5 个月前 32 0

近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域

英伟达Parakeet-TDT-0.6B-V2 ASR:超高效秒转60分钟低词错率兼容广开源灵活
AI妹 5 个月前 14 0

近日,英偉達在 Hugging Face 平臺上推出了其最新的自動語音識別(ASR)模型 ——Parakeet-TDT-0.6B-V2。這一新模型不僅在性能上有顯著提升,還將開源理念與商業應用相結

LLaMA-Omni2语音模型:高质量实时交互与多模块融合突破
AI妹 5 个月前 15 0

最近 AI 圈可是熱鬧非凡,今天咱們就來聊聊其中的 “狠角色”——LLaMA-Omni2。這是一系列超厲害的語音語言模型(SpeechLMs),參數規模從0.5B 到14B 不等,專門爲實現高質量

NVIDIA发布Canary-Qwen-2.5B混合模型 创ASR新纪录且支持商业开源
AI妹 5 个月前 14 0

NVIDIA刚刚发布了Canary-Qwen-2.5B,这是一款突破性的自动语音识别(ASR)和语言模型(LLM)混合模型,以创纪录的5.63%词错率(WER)荣登Hugging Face Ope