关闭导航

包含标签"音频理解"的内容

小米发布并开源MiDashengLM-7B多模态大模型 音频理解性能效率双突破
AI妹 1 个月前 8 0

小米今日正式发布并全量开源了MiDashengLM-7B多模态大模型,这款专注于音频理解的AI模型在性能和效率两个维度都实现了显著突破。该模型不仅在22个公开评测集上刷新了多模态大模型的最好成绩,

谷歌Gemma3n:低资源设备多模态AI模型,引领移动端智能新趋势
AI妹 1 个月前 10 0

谷歌在I/O2025大会上正式揭晓Gemma3n,一款专为低资源设备设计的多模态AI模型,仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。Gemma3n继承了Gemini Nano的架构

谷歌Gemma3n:2GB RAM低资源设备多模态移动AI技术新突破
AI妹 1 个月前 9 0

At the I/O 2025 conference, Google officially unveiled Gemma3n, a multi-modal AI model designed sp

昆仑元AI发布昇腾平台全模态融合模型BaiZe-Omni-14b-a2b性能突出
AI妹 1 个月前 17 0

在2025世界计算大会上,昆仑元 AI 正式发布了基于昇腾(Ascend)平台的全模态融合模型 BaiZe-Omni-14b-a2b。这一新模型具备强大的文本、音频、图像和视频理解与生成能力,采用