ASR - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"ASR"的内容

阿里语音大模型Fun-Realtime-TTS-Preview获全球第五国产第一横扫三大核心语音赛道

阿里语音大模型Fun-Realtime-TTS-Preview获全球第五国产第一横扫三大核心语音赛道

AI妹 13 天前 1 0

2026 年 5 月 28 日，全球权威 AI 评测平台 Artificial Analysis 发布了最新一期语音排行榜（Speech Arena）。阿里巴巴凭借语音大模型 Fun-Realti

实时语音合成毫秒级延迟 TTS 数字人直播 ASR

查看详情

阶跃星辰StepAudio2.5TTS全球前三语音技术量产上车

阶跃星辰StepAudio2.5TTS全球前三语音技术量产上车

AI妹 1 个月前 1 0

在最新发布的全球权威TTS（语音合成）评测榜单Artificial Analysis Speech Arena Leaderboard中，来自中国的阶跃星辰(StepFun)展现出强劲实力。其语音

Realtime实时交互模型端到端语音大模型千万人设自定义功能吉利银河M9 音色复刻

查看详情

清华NLP实验室等联合发布UltraEval-Audio v1.1.0开源框架推动音频模型发展

清华NLP实验室等联合发布UltraEval-Audio v1.1.0开源框架推动音频模型发展

AI妹 5 个月前 32 0

近日，清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio，这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域

ASR 开源全模态模型 Codec 隔离推理

查看详情

英伟达Parakeet-TDT-0.6B-V2 ASR：超高效秒转60分钟低词错率兼容广开源灵活

英伟达Parakeet-TDT-0.6B-V2 ASR：超高效秒转60分钟低词错率兼容广开源灵活

AI妹 5 个月前 14 0

近日，英偉達在 Hugging Face 平臺上推出了其最新的自動語音識別（ASR）模型 ——Parakeet-TDT-0.6B-V2。這一新模型不僅在性能上有顯著提升，還將開源理念與商業應用相結

字幕生成器 TDT解码器对话式AI平台一秒转60分钟音频 Granary数据集

查看详情

LLaMA-Omni2语音模型：高质量实时交互与多模块融合突破

LLaMA-Omni2语音模型：高质量实时交互与多模块融合突破

AI妹 5 个月前 15 0

最近 AI 圈可是熱鬧非凡，今天咱們就來聊聊其中的 “狠角色”——LLaMA-Omni2。這是一系列超厲害的語音語言模型（SpeechLMs），參數規模從0.5B 到14B 不等，專門爲實現高質量

多轮对话样本 LLaMA-Omni 語音指令跟隨 Qwen2.5 HiFi-GAN声碼器

查看详情

NVIDIA发布Canary-Qwen-2.5B混合模型创ASR新纪录且支持商业开源

NVIDIA发布Canary-Qwen-2.5B混合模型创ASR新纪录且支持商业开源

AI妹 5 个月前 14 0

NVIDIA刚刚发布了Canary-Qwen-2.5B，这是一款突破性的自动语音识别（ASR）和语言模型(LLM)混合模型，以创纪录的5.63%词错率(WER)荣登Hugging Face Ope

摘要模块化 GeForce RTX5090 音频知识提取 ASR

查看详情



资讯姬

文章数量13559

总阅读量242.561k

总评论量0

会员数量2

本站由emlog驱动