推理速度提升 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"推理速度提升"的内容

谷歌TurboQuant技术：攻克KV缓存瓶颈，大幅压缩AI内存更显著提升推理速度

谷歌TurboQuant技术：攻克KV缓存瓶颈，大幅压缩AI内存更显著提升推理速度

AI妹 2 个月前 4 0

在大语言模型（LLM）的推理过程中，内存瓶颈一直是制约性能的“头号杀手”。每当 AI 处理长文本或生成复杂回答时，一种被称为 KV 缓存(Key-Value Cache)的“工作内存”就会迅速膨胀

LLM 推理速度提升 ICLR2026会议 Gemma 长上下文测试

查看详情

黄仁勋CES正式发布Nvidia Rubin计算架构已量产下半年推广性能提升获多家云服务商采用

黄仁勋CES正式发布Nvidia Rubin计算架构已量产下半年推广性能提升获多家云服务商采用

AI妹 5 个月前 35 0

在今日的消费电子展（CES）上，Nvidia 首席执行官黄仁勋正式发布了公司全新的 Rubin 计算架构，他称其为当前人工智能硬件的尖端之作。Rubin 架构目前已经进入生产阶段，预计将在下半年加

Vera Florence Cooper Rubin OpenAI 超级计算机黄仁勋劳伦斯·伯克利国家实验室

查看详情

字节跳动Seed团队推出Seed Diffusion Preview 离散扩散模型推理提速5.4倍

字节跳动Seed团队推出Seed Diffusion Preview 离散扩散模型推理提速5.4倍

AI妹 5 个月前 16 0

字节跳动Seed团队宣布推出实验性扩散语言模型Seed Diffusion Preview，标志着在语言模型领域的一次重大技术突破。该模型旨在通过结构化的代码生成实验，验证离散扩散技术路线作为下一

自回归模型字节跳动Seed团队 Seed Diffusion Preview 块级并行扩散采样方案扩散语言模型

查看详情

DeepSeek-R1重大更新：代码推理能力提升开源对标o1成本优势显著

DeepSeek-R1重大更新：代码推理能力提升开源对标o1成本优势显著

AI妹 5 个月前 17 0

DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新，显著提升了模型在代码生成和复杂推理任务中的表现，引发人工智能领域的广泛关注。以下基于公开信息

API定价推理速度提升训练成本强化学习阿里QwQ32B

查看详情

港理工与OPPO研究院联合推出DLoRAL 基于扩散模型实现视频超分辨率新突破

港理工与OPPO研究院联合推出DLoRAL 基于扩散模型实现视频超分辨率新突破

AI妹 5 个月前 18 0

随着大模型技术突飞猛进，图片放大变高清已成常态，但视频高清化仍是一大挑战。近日，香港理工大学与OPPO研究院联合推出开源框架DLoRAL，基于扩散模型（Diffusion Model），实现一步生

增强阶段推理速度提升视频超分辨率双阶段训练策略香港理工大学

查看详情

Liquid AI开源LFM2边缘模型高效隐私特性引领行业新方向

Liquid AI开源LFM2边缘模型高效隐私特性引领行业新方向

AI妹 5 个月前 21 0

Liquid AI 宣布正式开源其下一代 Liquid Foundation Models（LFM2），这一突破性举措在人工智能领域掀起热议。作为专为边缘设备优化的高效混合模型，LFM2在速度、能

混合架构技术创新开源透明化 iOS原生应用 Hugging Face

查看详情

中国深度求索发布DeepSeek-V3.2系列模型含DSA架构与Agent优先能力

中国深度求索发布DeepSeek-V3.2系列模型含DSA架构与Agent优先能力

AI妹 6 个月前 29 0

12月1日 — 中国人工智能初创公司深度求索（DeepSeek AI）发布了DeepSeek-V3.2系列模型。该模型包括DeepSeek-V3.2及其高计算增强版DeepSeek-V3.2-Sp

泛化能力深度求索思考模式 DeepSeek-V3.2 稀疏注意力

查看详情

WBD采用AWS Graviton优化AI推理降本60%且延迟显著降低

（注：标题共28字，涵盖主体WBD、技术AWS Graviton、领域AI推理、核心成果降本与延迟优化，符合要求）

WBD采用AWS Graviton优化AI推理降本60%且延迟显著降低（注：标题共28字，涵盖主体WBD、技术AWS Graviton、领域AI推理、核心成果降本与延迟优化，符合要求）

AI妹 6 个月前 18 0

华纳兄弟探索公司（WBD）是一家全球领先的媒体与娱乐公司，拥有丰富的内容组合，涵盖电视、电影和流媒体等多个领域。随着用户对个性化内容的需求不断增加，该公司决定通过改进其人工智能和机器学习(AI/M

XGBoost模型推理速度提升 Amazon SageMaker AI实例华纳兄弟探索公司（WBD）成本节约

查看详情



资讯姬

文章数量13547

总阅读量240.562k

总评论量0

会员数量2

本站由emlog驱动