关闭导航

包含标签"WER"的内容

英伟达Parakeet-TDT-0.6B-V2 ASR:超高效秒转60分钟低词错率兼容广开源灵活
AI妹 1 个月前 8 0

近日,英偉達在 Hugging Face 平臺上推出了其最新的自動語音識別(ASR)模型 ——Parakeet-TDT-0.6B-V2。這一新模型不僅在性能上有顯著提升,還將開源理念與商業應用相結

MiniMax Speech-02登顶国际权威音声榜单 超越OpenAI等巨头创SOTA
AI妹 1 个月前 9 0

人工知能領域の急速な発展の中で、国産の大規模モデルの進化速度には驚かされます。今年の初めには、DeepSeek-R1が低コストでOpenAIを上回る性能を示し、海外の大規模モデルによる市場の独占的

通義大模型CoGenAV:音视频同步语音技术革新 多任务性能优异
AI妹 1 个月前 10 0

最近、通義大模型はCoGenAVを発表しました。これは音声と映像の同期というアイデアに基づいて音声認識技術を革新し、雑音干渉による問題を効果的に解決しています。 従来の音声認識技術はノイズ環境

NVIDIA发布Canary-Qwen-2.5B混合模型 创ASR新纪录且支持商业开源
AI妹 1 个月前 10 0

NVIDIA刚刚发布了Canary-Qwen-2.5B,这是一款突破性的自动语音识别(ASR)和语言模型(LLM)混合模型,以创纪录的5.63%词错率(WER)荣登Hugging Face Ope