大模型推理正在重新定义AI基础设施,网络架构创新成为释放硬件潜能的关键路径。2025年9月,智谱、驭驯网络与清华大学在网络领域顶级会议ACM SIGCOMM2025上发表了关于ZCube网络架构的
在移动端运行大模型已不再是新鲜事,但让浏览器具备强悍的 AI 处理能力正成为新的技术趋势。近日,开发者通过引入 Google 最新的 TurboQuant 算法,成功将 Gemma4模型搬进了浏览
在今日的消费电子展(CES)上,Nvidia 首席执行官黄仁勋正式发布了公司全新的 Rubin 计算架构,他称其为当前人工智能硬件的尖端之作。Rubin 架构目前已经进入生产阶段,预计将在下半年加
ByteDance has announced the launch of Efficient Pretraining Length Scaling, leveraging a novel Par
中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型,专为数学推