近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域
近日,英偉達在 Hugging Face 平臺上推出了其最新的自動語音識別(ASR)模型 ——Parakeet-TDT-0.6B-V2。這一新模型不僅在性能上有顯著提升,還將開源理念與商業應用相結
最近 AI 圈可是熱鬧非凡,今天咱們就來聊聊其中的 “狠角色”——LLaMA-Omni2。這是一系列超厲害的語音語言模型(SpeechLMs),參數規模從0.5B 到14B 不等,專門爲實現高質量
NVIDIA刚刚发布了Canary-Qwen-2.5B,这是一款突破性的自动语音识别(ASR)和语言模型(LLM)混合模型,以创纪录的5.63%词错率(WER)荣登Hugging Face Ope
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论