KV Cache - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"KV Cache"的内容

智谱ZCube架构成功落地GLM-5.1coding 提升推理性能降低成本

智谱ZCube架构成功落地GLM-5.1coding 提升推理性能降低成本

AI妹 19 天前 1 0

大模型推理正在重新定义AI基础设施，网络架构创新成为释放硬件潜能的关键路径。2025年9月，智谱、驭驯网络与清华大学在网络领域顶级会议ACM SIGCOMM2025上发表了关于ZCube网络架构的

超大规模扩展 ROFT架构静态拓扑 AI基础设施 Token生产效率

查看详情

TurboQuant算法助力Gemma4模型在浏览器本地零成本流畅运行

TurboQuant算法助力Gemma4模型在浏览器本地零成本流畅运行

AI妹 1 个月前 2 0

在移动端运行大模型已不再是新鲜事，但让浏览器具备强悍的 AI 处理能力正成为新的技术趋势。近日，开发者通过引入 Google 最新的 TurboQuant 算法，成功将 Gemma4模型搬进了浏览

本地AI交互 Excalidraw流程图本地化AI应用创作零成本浏览器AI处理能力

查看详情

黄仁勋CES正式发布Nvidia Rubin计算架构已量产下半年推广性能提升获多家云服务商采用

黄仁勋CES正式发布Nvidia Rubin计算架构已量产下半年推广性能提升获多家云服务商采用

AI妹 5 个月前 35 0

在今日的消费电子展（CES）上，Nvidia 首席执行官黄仁勋正式发布了公司全新的 Rubin 计算架构，他称其为当前人工智能硬件的尖端之作。Rubin 架构目前已经进入生产阶段，预计将在下半年加

云服务提供商 Vera CPU AWS KV Cache Lovelace架构

查看详情

字节跳动PHD-Transformer技术突破LLM 2M上下文预训练效率瓶颈

字节跳动PHD-Transformer技术突破LLM 2M上下文预训练效率瓶颈

AI妹 5 个月前 18 0

ByteDance has announced the launch of Efficient Pretraining Length Scaling, leveraging a novel Par

arxiv Hugging Face PHD-CSWA ByteDance PyTorch

查看详情

DeepSeek发布6710亿参数开源数学推理模型推动全球AI研究与应用

DeepSeek发布6710亿参数开源数学推理模型推动全球AI研究与应用

AI妹 5 个月前 18 0

中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮，正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型，专为数学推

6710亿参数 DeepSeek-Prover-V2-671B DeepSeek-R2 KV Cache 数学推理

查看详情

中国AI初创公司DeepSeek发布6710亿参数开源数学推理模型掀全球AI热潮

中国AI初创公司DeepSeek发布6710亿参数开源数学推理模型掀全球AI热潮

AI妹 5 个月前 18 0

中國 AI 初創公司 DeepSeek 再次掀起開源 AI 領域的熱潮，正式發佈其最新開源模型 DeepSeek-Prover-V2-671B。這一擁有6710億參數的超大規模語言模型，專爲數學推

V3模型高效AI开发降低研究门槛 6710亿参数 AI生态

查看详情



资讯姬

文章数量13541

总阅读量236.282k

总评论量0

会员数量2

本站由emlog驱动