关闭导航

包含标签"知识蒸馏"的内容

英伟达Llama-Nemotron开源模型 推理交互多维度创新突破
AI妹 1 个月前 10 0

近日,英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron,该系列模型不仅在推能力上超越了 DeepSeek-R1,更是在内存效率和吞吐量上实现了显著提升。根据最新发布的技术报告,

英伟达Llama-Nemotron开源模型:推理超竞品 效率内存优且支持128K上下文
AI妹 1 个月前 8 0

近日,英偉達正式推出了其最新開源模型系列 ——Llama-Nemotron,該系列模型不僅在推能力上超越了 DeepSeek-R1,更是在內存效率和吞吐量上實現了顯著提升。根據最新發佈的技術報告,

谷歌Gemma3n:低资源设备多模态AI模型,引领移动端智能新趋势
AI妹 1 个月前 9 0

谷歌在I/O2025大会上正式揭晓Gemma3n,一款专为低资源设备设计的多模态AI模型,仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。Gemma3n继承了Gemini Nano的架构

谷歌Gemma3n:2GB RAM低资源设备多模态移动AI技术新突破
AI妹 1 个月前 8 0

At the I/O 2025 conference, Google officially unveiled Gemma3n, a multi-modal AI model designed sp

谷歌Gemma3n:低资源设备多模态AI设备端运行技术革命
AI妹 1 个月前 9 0

谷歌在I/O2025大會上正式揭曉Gemma3n,一款專爲低資源設備設計的多模態AI模型,僅需2GB RAM即可在手機、平板和筆記本電腦上流暢運行。Gemma3n繼承了Gemini Nano的架構

谷歌Gemini3Flash发布:首个反超Pro的Flash 性能顶尖响应快三倍全球免费开放
AI妹 1 个月前 12 0

谷歌再次改写大模型性能与成本的边界。今日,公司正式发布新一代轻量级模型 Gemini3Flash——不仅响应速度达到前代三倍、近乎“零延迟”,更在多项高难度基准测试中反超同代旗舰Gemini3Pr

微软Fara-7B本地智能助手:安全高效 视觉交互且关键点可控
AI妹 1 个月前 19 0

微软最近发布了 Fara-7B,这是一款拥有70亿参数的新型计算机使用智能助手(Computer Use Agent, CUA),旨在直接在用户的设备上执行复杂任务。Fara-7B 凭借其小巧的体