关闭导航

包含标签"内存带宽"的内容

谷歌DeepMind MoR架构高效超越传统Transformer 成AI大型模型新突破
AI妹 1 个月前 7 0

在人工智能领域,大型语言模型(LLM)因其出色的表现而受到广泛关注,但其在部署时却面临着巨大的计算和内存开销问题。为了克服这一挑战,谷歌 DeepMind 最近推出了一种新架构 ——Mixture

博通获Anthropic 210亿TPU订单 TPU成本优势挑战NVIDIA GPU
AI妹 1 个月前 12 0

在最近的财报会议上,Broadcom 的 CEO Hock Tan 透露,该公司在前一季度收到了来自 Anthropic 的100亿美元订单,专门用于提供谷歌最新的张量处理单元(TPU)。此外,T