在音频技术飞速发展的今天,如何对音频模型进行有效评测已成为研究者们的重要课题。近日,清华大学 NLP 实验室、OpenBMB 与面壁智能联合推出了 UltraEval-Audio,这是一个专为音频
Perplexity AI在其iOS應用中推出全新語音助手功能,進一步增強了AI助手的實用性與交互體驗。據AIbase瞭解,新功能支持設置鬧鐘、查找路線、發送消息、預訂餐廳等多項任務,結合強大的實
Perplexity AI在其iOS应用中推出全新语音助手功能,进一步增强了AI助手的实用性与交互体验。据AIbase了解,新功能支持设置闹钟、查找路线、发送消息、预订餐厅等多项任务,结合强大的实
近日,英伟达在 Hugging Face 平台上推出了其最新的自动语音识别(ASR)模型 ——Parakeet-TDT-0.6B-V2。这一新模型不仅在性能上有显著提升,还将开源理念与商业应用相结
最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量
NVIDIA剛剛發佈了Canary-Qwen-2.5B,這是一款突破性的自動語音識別(ASR)和語言模型(LLM)混合模型,以創紀錄的5.63%詞錯率(WER)榮登Hugging Face Ope
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论