关闭导航

包含标签"推理速度提升"的内容

黄仁勋CES正式发布Nvidia Rubin计算架构 已量产 下半年推广 性能提升获多家云服务商采用
AI妹 14 天前 9 0

在今日的消费电子展(CES)上,Nvidia 首席执行官黄仁勋正式发布了公司全新的 Rubin 计算架构,他称其为当前人工智能硬件的尖端之作。Rubin 架构目前已经进入生产阶段,预计将在下半年加

字节跳动Seed团队推出Seed Diffusion Preview 离散扩散模型推理提速5.4倍
AI妹 1 个月前 9 0

字节跳动Seed团队宣布推出实验性扩散语言模型Seed Diffusion Preview,标志着在语言模型领域的一次重大技术突破。该模型旨在通过结构化的代码生成实验,验证离散扩散技术路线作为下一

DeepSeek-R1重大更新:代码推理能力提升 开源对标o1成本优势显著
AI妹 1 个月前 9 0

 DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。以下基于公开信息

港理工与OPPO研究院联合推出DLoRAL 基于扩散模型实现视频超分辨率新突破
AI妹 1 个月前 9 0

随着大模型技术突飞猛进,图片放大变高清已成常态,但视频高清化仍是一大挑战。近日,香港理工大学与OPPO研究院联合推出开源框架DLoRAL,基于扩散模型(Diffusion Model),实现一步生

Liquid AI开源LFM2边缘模型 高效隐私特性引领行业新方向
AI妹 1 个月前 10 0

Liquid AI 宣布正式开源其下一代 Liquid Foundation Models(LFM2),这一突破性举措在人工智能领域掀起热议。作为专为边缘设备优化的高效混合模型,LFM2在速度、能

中国深度求索发布DeepSeek-V3.2系列模型 含DSA架构与Agent优先能力
AI妹 1 个月前 19 0

12月1日 — 中国人工智能初创公司深度求索(DeepSeek AI)发布了DeepSeek-V3.2系列模型。该模型包括DeepSeek-V3.2及其高计算增强版DeepSeek-V3.2-Sp

WBD采用AWS Graviton优化AI推理 降本60%且延迟显著降低

(注:标题共28字,涵盖主体WBD、技术AWS Graviton、领域AI推理、核心成果降本与延迟优化,符合要求)
AI妹 1 个月前 12 0

华纳兄弟探索公司(WBD)是一家全球领先的媒体与娱乐公司,拥有丰富的内容组合,涵盖电视、电影和流媒体等多个领域。随着用户对个性化内容的需求不断增加,该公司决定通过改进其人工智能和机器学习(AI/M