关闭导航

包含标签"KV Cache"的内容

智谱ZCube架构成功落地GLM-5.1coding 提升推理性能降低成本
AI妹 19 天前 1 0

大模型推理正在重新定义AI基础设施,网络架构创新成为释放硬件潜能的关键路径。2025年9月,智谱、驭驯网络与清华大学在网络领域顶级会议ACM SIGCOMM2025上发表了关于ZCube网络架构的

TurboQuant算法助力Gemma4模型在浏览器本地零成本流畅运行
AI妹 1 个月前 2 0

在移动端运行大模型已不再是新鲜事,但让浏览器具备强悍的 AI 处理能力正成为新的技术趋势。近日,开发者通过引入 Google 最新的 TurboQuant 算法,成功将 Gemma4模型搬进了浏览

黄仁勋CES正式发布Nvidia Rubin计算架构 已量产 下半年推广 性能提升获多家云服务商采用
AI妹 5 个月前 35 0

在今日的消费电子展(CES)上,Nvidia 首席执行官黄仁勋正式发布了公司全新的 Rubin 计算架构,他称其为当前人工智能硬件的尖端之作。Rubin 架构目前已经进入生产阶段,预计将在下半年加

字节跳动PHD-Transformer技术突破LLM 2M上下文预训练效率瓶颈
AI妹 5 个月前 18 0

ByteDance has announced the launch of Efficient Pretraining Length Scaling, leveraging a novel Par

DeepSeek发布6710亿参数开源数学推理模型 推动全球AI研究与应用
AI妹 5 个月前 18 0

中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型,专为数学推

中国AI初创公司DeepSeek发布6710亿参数开源数学推理模型掀全球AI热潮
AI妹 5 个月前 18 0

中國 AI 初創公司 DeepSeek 再次掀起開源 AI 領域的熱潮,正式發佈其最新開源模型 DeepSeek-Prover-V2-671B。這一擁有6710億參數的超大規模語言模型,專爲數學推