3月26日消息,谷歌研究团队(Google Research)近日正式推出全新向量量化压缩算法TurboQuant,通过创新的 PolarQuant 与 QJL 技术,将大语言模型(LLM)推理过
在大语言模型(LLM)的推理过程中,内存瓶颈一直是制约性能的“头号杀手”。每当 AI 处理长文本或生成复杂回答时,一种被称为 KV 缓存(Key-Value Cache)的“工作内存”就会迅速膨胀
近日,一场关于 AI 架构起源的争论在社交媒体上闹得沸沸扬扬。被誉为“欧洲版 OpenAI”的MistralCEO Arthur Mensch 在接受访谈时表示,中国强劲的开源模型DeepSeek
据 AIbase 报道,全球最大 AI 开源社区 Hugging Face 的最新数据显示,阿里巴巴旗下的通义千问(Qwen)大模型正以断层优势领跑全球开源生态。截至2026年1月初,千问系列模型
Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,这一举措引发了 AI 社区的广泛关注。作为一款专为 Intel Arc GPU 和集成显卡优化的 AI 工具,AI P
Intel 宣佈將其生成式 AI 軟件 AI Playground 正式開源,這一舉措引發了 AI 社區的廣泛關注。作爲一款專爲 Intel Arc GPU 和集成顯卡優化的 AI 工具,AI P
インテルは、生成AIソフトウェア「AI Playground」の正式オープンソース化を発表し、AIコミュニティから大きな注目を集めています。インテルArc GPUと統合グラフィックスに最適化された
NVIDIA宣佈推出NIM Operator2.0,專爲Kubernetes環境設計,旨在簡化NIM和NeMo微服務的部署、擴展與管理。據AIbase瞭解,新版本引入了定製器(Customizer
信用卡巨頭 Visa 正式進軍人工智能代理領域。該公司週三宣佈,將與包括 OpenAI、微軟和 Anthropic 在內的多家領先人工智能開發商合作,將其龐大的支付網絡與他們的人工智能系統連
信用卡巨头 Visa 正式进军人工智能代理领域。该公司周三宣布,将与包括 OpenAI、微软和 Anthropic 在内的多家领先人工智能开发商合作,将其庞大的支付网络与他们的人工智能系统连