Gemma - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"Gemma"的内容

谷歌TurboQuant显著压缩KV Cache，提升LLM推理效率且零精度损失

谷歌TurboQuant显著压缩KV Cache，提升LLM推理效率且零精度损失

AI妹 2 个月前 3 0

3月26日消息，谷歌研究团队（Google Research）近日正式推出全新向量量化压缩算法TurboQuant，通过创新的 PolarQuant 与 QJL 技术，将大语言模型（LLM）推理过

RabbiQ QJL技术长上下文基准测试 Nvidia H100GPU 无训练压缩框架

查看详情

谷歌TurboQuant技术：攻克KV缓存瓶颈，大幅压缩AI内存更显著提升推理速度

谷歌TurboQuant技术：攻克KV缓存瓶颈，大幅压缩AI内存更显著提升推理速度

AI妹 2 个月前 3 0

在大语言模型（LLM）的推理过程中，内存瓶颈一直是制约性能的“头号杀手”。每当 AI 处理长文本或生成复杂回答时，一种被称为 KV 缓存(Key-Value Cache)的“工作内存”就会迅速膨胀

Key-Value Cache 大语言模型 Mistral LLM 内存压缩技术

查看详情

研究揭示开源大语言模型脱离平台护栏易被黑客利用存严重安全风险

研究揭示开源大语言模型脱离平台护栏易被黑客利用存严重安全风险

AI妹 4 个月前 87 0

近日，网络安全公司 SentinelOne 与 Censys 联合发布的一项深度研究揭示了开源大语言模型面临的严峻安全挑战。研究指出，当这些模型脱离主流托管平台的“护栏”与安全限制，在外部私有计

开源大语言模型 Gemma Llama 安全护栏移除系统提示词

查看详情

NVIDIA发布NIM Operator2.0 赋能Kubernetes环境AI微服务高效安全管理

NVIDIA发布NIM Operator2.0 赋能Kubernetes环境AI微服务高效安全管理

AI妹 5 个月前 18 0

NVIDIA宣佈推出NIM Operator2.0，專爲Kubernetes環境設計，旨在簡化NIM和NeMo微服務的部署、擴展與管理。據AIbase瞭解，新版本引入了定製器（Customizer

多模型兼容 Gemma Llama NVIDIA NIM Operator2.0 企业级AI工作流

查看详情

Google Gemma AI模型下载破1.5亿次多模态多语言受关注与Llama竞争存争议

Google Gemma AI模型下载破1.5亿次多模态多语言受关注与Llama竞争存争议

AI妹 5 个月前 15 0

Googleは最近、自社の人工知能モデルコレクションであるGemmaのダウンロード数が1億5000万回を突破したことを発表しました。これは、プロジェクトが大きな進展を遂げたことを示しています。Go

图像处理 AI模型多模态药物研究微调 Meta

查看详情

Google Gemma模型下载破1.5亿多模態特性與Llama競爭引關注

Google Gemma模型下载破1.5亿多模態特性與Llama競爭引關注

AI妹 5 个月前 20 0

Google 近期宣佈，其人工智能模型集合 Gemma 的下載量已經突破1.5億次，標誌着該項目取得了顯著進展。Google DeepMind 的開發者關係工程師 Omar Sanseviero

人工智能模型许可条款争议下载量1.5亿次 Google Gemma

查看详情



资讯姬

文章数量13527

总阅读量229.338k

总评论量0

会员数量2

本站由emlog驱动