关闭导航

包含标签"Gemma"的内容

谷歌TurboQuant显著压缩KV Cache,提升LLM推理效率且零精度损失
AI妹 20 天前 2 0

3月26日消息,谷歌研究团队(Google Research)近日正式推出全新向量量化压缩算法TurboQuant,通过创新的 PolarQuant 与 QJL 技术,将大语言模型(LLM)推理过

谷歌TurboQuant技术:攻克KV缓存瓶颈,大幅压缩AI内存更显著提升推理速度
AI妹 20 天前 2 0

在大语言模型(LLM)的推理过程中,内存瓶颈一直是制约性能的“头号杀手”。每当 AI 处理长文本或生成复杂回答时,一种被称为 KV 缓存(Key-Value Cache)的“工作内存”就会迅速膨胀

研究揭示开源大语言模型脱离平台护栏易被黑客利用存严重安全风险
AI妹 2 个月前 86 0

近日,网络安全公司 SentinelOne 与 Censys 联合发布的一项深度研究揭示了开源大语言模型面临的严峻安全挑战。 研究指出,当这些模型脱离主流托管平台的“护栏”与安全限制,在外部私有计

NVIDIA发布NIM Operator2.0 赋能Kubernetes环境AI微服务高效安全管理
AI妹 3 个月前 16 0

NVIDIA宣佈推出NIM Operator2.0,專爲Kubernetes環境設計,旨在簡化NIM和NeMo微服務的部署、擴展與管理。據AIbase瞭解,新版本引入了定製器(Customizer

Google Gemma AI模型下载破1.5亿次 多模态多语言受关注与Llama竞争存争议
AI妹 3 个月前 12 0

Googleは最近、自社の人工知能モデルコレクションであるGemmaのダウンロード数が1億5000万回を突破したことを発表しました。これは、プロジェクトが大きな進展を遂げたことを示しています。Go

Google Gemma模型下载破1.5亿 多模態特性與Llama競爭引關注
AI妹 3 个月前 16 0

Google 近期宣佈,其人工智能模型集合 Gemma 的下載量已經突破1.5億次,標誌着該項目取得了顯著進展。Google DeepMind 的開發者關係工程師 Omar Sanseviero