音频理解 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"音频理解"的内容

英伟达发布Nemotron3 Nano Omni多模态模型整合视音频图文效率高表现优异

英伟达发布Nemotron3 Nano Omni多模态模型整合视音频图文效率高表现优异

AI妹 1 个月前 1 0

英伟达发布了其开放式多模态模型 “Nemotron 3 Nano Omni”，这款新模型将视频、音频、图像和文本的推理能力整合到一个系统中，旨在为用户提供更快速和智能的响应。根据英伟达的介绍，这款

吞吐量智能体技术六大权威排行榜开放式多模态模型 30B-A3B混合专家架构

查看详情

小米发布并开源MiDashengLM-7B多模态大模型音频理解性能效率双突破

小米发布并开源MiDashengLM-7B多模态大模型音频理解性能效率双突破

AI妹 5 个月前 15 0

小米今日正式发布并全量开源了MiDashengLM-7B多模态大模型，这款专注于音频理解的AI模型在性能和效率两个维度都实现了显著突破。该模型不仅在22个公开评测集上刷新了多模态大模型的最好成绩，

双核心架构音频理解全量开源 Dasheng系列声音编辑功能

查看详情

谷歌Gemma3n：低资源设备多模态AI模型，引领移动端智能新趋势

谷歌Gemma3n：低资源设备多模态AI模型，引领移动端智能新趋势

AI妹 5 个月前 16 0

谷歌在I/O2025大会上正式揭晓Gemma3n，一款专为低资源设备设计的多模态AI模型，仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。Gemma3n继承了Gemini Nano的架构

多模态融合 LMSYS Chatbot Arena 知识蒸馏 Gemini Nano架构移动端AI

查看详情

谷歌Gemma3n：2GB RAM低资源设备多模态移动AI技术新突破

谷歌Gemma3n：2GB RAM低资源设备多模态移动AI技术新突破

AI妹 5 个月前 18 0

At the I/O 2025 conference, Google officially unveiled Gemma3n, a multi-modal AI model designed sp

低资源设备 Layer-by-layer embedding IoT设备边缘计算移动AI

查看详情

昆仑元AI发布昇腾平台全模态融合模型BaiZe-Omni-14b-a2b性能突出

昆仑元AI发布昇腾平台全模态融合模型BaiZe-Omni-14b-a2b性能突出

AI妹 6 个月前 24 0

在2025世界计算大会上，昆仑元 AI 正式发布了基于昇腾（Ascend）平台的全模态融合模型 BaiZe-Omni-14b-a2b。这一新模型具备强大的文本、音频、图像和视频理解与生成能力，采用

全模态融合模型昇腾平台单层混合注意力聚合层 ROUGE-L得分0.521 文本理解

查看详情



资讯姬

文章数量13527

总阅读量228.449k

总评论量0

会员数量2

本站由emlog驱动