关闭导航

包含标签"AI推理"的内容

英伟达拟推OpenAI定制处理器 战略转型稳核心客户聚焦推理效率
AI妹 1 个月前 2 0

硅谷的“算力霸主”正以一次前所未有的战略调头,重新定义 AI 推理的边界。2026 年 2 月 27 日,据知情人士披露, 英伟达 (NVIDIA) 计划推出一款专为

vLLM团队创Inferact种子轮8亿估值融资 引领AI推理算力效率革命
AI妹 2 个月前 24 0

当全球AI的聚光灯还流连于那些吞噬万亿参数的巨型模型时,一场关于算力效率的革命已经在底层代码的深处悄然爆发。作为全球顶尖开源推理引擎vLLM的造物主们,今日正式向世界宣告了他们的野心:成立AI基础

Anthropic推出AI for Science计划 免费API积分助力生命科学研究
AI妹 3 个月前 17 0

AI 技术公司 Anthropic 于5月6日宣布推出一项名为 “AI for Science” 的新计划,旨在为生命科学等领域的研究人员提供免费 API 积分,以帮助他们加速科学研究和发现。该计

摩尔线程自主研发MUSA架构成功适配llama.cpp 提升AI大模型推理效率

(注:标题涵盖核心主体“摩尔线程MUSA架构”、关键事件“适配llama.cpp”及意义“提升AI推理效率”,符合30字左右要求,突出原文核心信息。)
AI妹 3 个月前 15 0

在全球人工智能技术飞速发展的今天,摩尔线程(Moore Threads)又有了新的突破!其自主研发的通用并行计算架构 MUSA(Meta-computing Unified System Arch

摩尔线程MUSA架构适配llama.cpp 提升本土AI硬件推理效率与生态活力
AI妹 3 个月前 13 0

在全球人工智能技術飛速發展的今天,摩爾線程(Moore Threads)又有了新的突破!其自主研發的通用並行計算架構 MUSA(Meta-computing Unified System Arch

红帽牵头启动llm-d开源项目 联合产业巨头应对AI大规模推理需求
AI妹 3 个月前 11 0

全球开源解决方案领导者红帽公司近日宣布启动革命性开源项目llm-d,专门应对生成式AI大规模推理的迫切需求。该项目汇聚了CoreWeave、Google Cloud、IBM Research和NV

苹果自研推理优先AI服务器芯片Baltra 2027年启用旨在摆脱英伟达依赖
AI妹 4 个月前 18 0

科技媒体 Wccftech 昨日(12月15日)报道称,苹果公司正在深化其“垂直整合”战略,不仅限于消费电子产品,更已将触角伸向核心算力基础设施,加速研发代号为 “Baltra” 的首款自研 AI

博通获Anthropic 210亿TPU订单 TPU成本优势挑战NVIDIA GPU
AI妹 4 个月前 20 0

在最近的财报会议上,Broadcom 的 CEO Hock Tan 透露,该公司在前一季度收到了来自 Anthropic 的100亿美元订单,专门用于提供谷歌最新的张量处理单元(TPU)。此外,T