关闭导航

包含标签"音频理解"的内容

英伟达发布Nemotron3 Nano Omni多模态模型 整合视音频图文效率高表现优异
AI妹 1 个月前 1 0

英伟达发布了其开放式多模态模型 “Nemotron 3 Nano Omni”,这款新模型将视频、音频、图像和文本的推理能力整合到一个系统中,旨在为用户提供更快速和智能的响应。根据英伟达的介绍,这款

小米发布并开源MiDashengLM-7B多模态大模型 音频理解性能效率双突破
AI妹 5 个月前 15 0

小米今日正式发布并全量开源了MiDashengLM-7B多模态大模型,这款专注于音频理解的AI模型在性能和效率两个维度都实现了显著突破。该模型不仅在22个公开评测集上刷新了多模态大模型的最好成绩,

谷歌Gemma3n:低资源设备多模态AI模型,引领移动端智能新趋势
AI妹 5 个月前 16 0

谷歌在I/O2025大会上正式揭晓Gemma3n,一款专为低资源设备设计的多模态AI模型,仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。Gemma3n继承了Gemini Nano的架构

谷歌Gemma3n:2GB RAM低资源设备多模态移动AI技术新突破
AI妹 5 个月前 18 0

At the I/O 2025 conference, Google officially unveiled Gemma3n, a multi-modal AI model designed sp

昆仑元AI发布昇腾平台全模态融合模型BaiZe-Omni-14b-a2b性能突出
AI妹 6 个月前 24 0

在2025世界计算大会上,昆仑元 AI 正式发布了基于昇腾(Ascend)平台的全模态融合模型 BaiZe-Omni-14b-a2b。这一新模型具备强大的文本、音频、图像和视频理解与生成能力,采用