关闭导航

包含标签"KV Cache"的内容

黄仁勋CES正式发布Nvidia Rubin计算架构 已量产 下半年推广 性能提升获多家云服务商采用
AI妹 14 天前 8 0

在今日的消费电子展(CES)上,Nvidia 首席执行官黄仁勋正式发布了公司全新的 Rubin 计算架构,他称其为当前人工智能硬件的尖端之作。Rubin 架构目前已经进入生产阶段,预计将在下半年加

字节跳动PHD-Transformer技术突破LLM 2M上下文预训练效率瓶颈
AI妹 1 个月前 9 0

ByteDance has announced the launch of Efficient Pretraining Length Scaling, leveraging a novel Par

DeepSeek发布6710亿参数开源数学推理模型 推动全球AI研究与应用
AI妹 1 个月前 8 0

中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型,专为数学推

中国AI初创公司DeepSeek发布6710亿参数开源数学推理模型掀全球AI热潮
AI妹 1 个月前 8 0

中國 AI 初創公司 DeepSeek 再次掀起開源 AI 領域的熱潮,正式發佈其最新開源模型 DeepSeek-Prover-V2-671B。這一擁有6710億參數的超大規模語言模型,專爲數學推