关闭导航

包含标签"自动语音识别(ASR)"的内容

UltraEval-Audio新版本发布 开源助力音频模型评测标准化高效化
AI妹 15 天前 7 0

在音频技术飞速发展的今天,如何对音频模型进行有效评测已成为研究者们的重要课题。近日,清华大学 NLP 实验室、OpenBMB 与面壁智能联合推出了 UltraEval-Audio,这是一个专为音频

Perplexity AI iOS语音助手:多模智能交互、实用核心功能与全面场景应用详解
AI妹 1 个月前 11 0

Perplexity AI在其iOS應用中推出全新語音助手功能,進一步增強了AI助手的實用性與交互體驗。據AIbase瞭解,新功能支持設置鬧鐘、查找路線、發送消息、預訂餐廳等多項任務,結合強大的實

Perplexity AI iOS全新语音助手上线:多任务实时交互 社区反响热烈
AI妹 1 个月前 13 0

Perplexity AI在其iOS应用中推出全新语音助手功能,进一步增强了AI助手的实用性与交互体验。据AIbase了解,新功能支持设置闹钟、查找路线、发送消息、预订餐厅等多项任务,结合强大的实

英伟达Parakeet-TDT-0.6B-V2:秒转60分钟音频,低WER开源赋能各类语音场景应用
AI妹 1 个月前 9 0

近日,英伟达在 Hugging Face 平台上推出了其最新的自动语音识别(ASR)模型 ——Parakeet-TDT-0.6B-V2。这一新模型不仅在性能上有显著提升,还将开源理念与商业应用相结

LLaMA-Omni2语音语言模型:高质量实时交互性能超越前辈引关注
AI妹 1 个月前 7 0

最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量

NVIDIA Canary-Qwen-2.5B混合模型 登顶ASR榜 性能优商业开源支持企业应用
AI妹 1 个月前 8 0

NVIDIA剛剛發佈了Canary-Qwen-2.5B,這是一款突破性的自動語音識別(ASR)和語言模型(LLM)混合模型,以創紀錄的5.63%詞錯率(WER)榮登Hugging Face Ope