关闭导航

包含标签"ASR"的内容

清华NLP实验室等联合发布UltraEval-Audio v1.1.0开源框架推动音频模型发展
AI妹 15 天前 8 0

近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域

英伟达Parakeet-TDT-0.6B-V2 ASR:超高效秒转60分钟低词错率兼容广开源灵活
AI妹 1 个月前 7 0

近日,英偉達在 Hugging Face 平臺上推出了其最新的自動語音識別(ASR)模型 ——Parakeet-TDT-0.6B-V2。這一新模型不僅在性能上有顯著提升,還將開源理念與商業應用相結

LLaMA-Omni2语音模型:高质量实时交互与多模块融合突破
AI妹 1 个月前 7 0

最近 AI 圈可是熱鬧非凡,今天咱們就來聊聊其中的 “狠角色”——LLaMA-Omni2。這是一系列超厲害的語音語言模型(SpeechLMs),參數規模從0.5B 到14B 不等,專門爲實現高質量

NVIDIA发布Canary-Qwen-2.5B混合模型 创ASR新纪录且支持商业开源
AI妹 1 个月前 8 0

NVIDIA刚刚发布了Canary-Qwen-2.5B,这是一款突破性的自动语音识别(ASR)和语言模型(LLM)混合模型,以创纪录的5.63%词错率(WER)荣登Hugging Face Ope