关闭导航

包含标签"推理效率"的内容

小米正式开源MiDashengLM-7B多模态大模型 音频理解性能效率双突破创22项纪录
AI妹 1 个月前 9 0

Xiaomi officially released and fully open-sourced the MiDashengLM-7B multimodal large model today.

小米发布并开源MiDashengLM-7B多模态大模型 音频理解性能效率双突破
AI妹 1 个月前 8 0

小米今日正式发布并全量开源了MiDashengLM-7B多模态大模型,这款专注于音频理解的AI模型在性能和效率两个维度都实现了显著突破。该模型不仅在22个公开评测集上刷新了多模态大模型的最好成绩,

英伟达等研发Fast-dLLM 借KV缓存和平行解码提升扩散语言模型推理效率
AI妹 1 个月前 9 0

近日,英伟达、香港大学与麻省理工学院的研究团队联合发布了一种名为 Fast-dLLM 的创新技术,旨在提升扩散语言模型的推理效率。与传统的自回归模型不同,扩散语言模型采用逐步去除文本噪声的方式生成

Fast-dLLM:KV缓存与信頼度解码助力扩散语言模型推理加速
AI妹 1 个月前 6 0

最近、NVIDIA、香港大学およびマサチューセッツ工科大学の研究チームは、拡散言語モデルの推論効率を向上させるための新技術「Fast-dLLM」を発表しました。従来の自己回帰モデルとは異なり、拡散

微软开源Phi-4迷你闪速推理模型 凭SambaY推高效10倍适配边缘设备
AI妹 1 个月前 7 0

マイクロソフトは今日午前、公式ウェブサイトで最新バージョンのPhi-4ファミリー モデル「Phi-4-mini-flash-reasoning」をオープンソース化しました。この新しいバージョンは、

微软开源Phi-4-mini-flash-reasoning 借SambaY架构提升推理效率及长上下文能力
AI妹 1 个月前 9 0

微軟今天凌晨在官網上開源了最新版本的 Phi-4家族模型 ——Phi-4-mini-flash-reasoning。這一新版本在繼承了 Phi-4系列參數小、性能強的優點基礎上,專爲受到計算能力、

    1 2