关闭导航

包含标签"首Token时延(TTFT P99)"的内容

智谱ZCube架构成功落地GLM-5.1coding 提升推理性能降低成本
AI妹 19 天前 1 0

大模型推理正在重新定义AI基础设施,网络架构创新成为释放硬件潜能的关键路径。2025年9月,智谱、驭驯网络与清华大学在网络领域顶级会议ACM SIGCOMM2025上发表了关于ZCube网络架构的