内存效率 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"内存效率"的内容

英伟达Llama-Nemotron开源模型推理交互多维度创新突破

英伟达Llama-Nemotron开源模型推理交互多维度创新突破

AI妹 3 个月前 15 0

近日，英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron，该系列模型不仅在推能力上超越了 DeepSeek-R1，更是在内存效率和吞吐量上实现了显著提升。根据最新发布的技术报告，

Llama-Nemotron 科学推理 LN-Super49B 多步骤推理吞吐量

查看详情

英伟达Llama-Nemotron开源模型：推理超竞品效率内存优且支持128K上下文

英伟达Llama-Nemotron开源模型：推理超竞品效率内存优且支持128K上下文

AI妹 3 个月前 14 0

近日，英偉達正式推出了其最新開源模型系列 ——Llama-Nemotron，該系列模型不僅在推能力上超越了 DeepSeek-R1，更是在內存效率和吞吐量上實現了顯著提升。根據最新發佈的技術報告，

合成数据监督微调知识蒸馏 Puzzle框架科学推理推理能力

查看详情

DeepSeek发布最新V3模型技术论文探讨大模型扩展挑战与硬件设计思考

DeepSeek发布最新V3模型技术论文探讨大模型扩展挑战与硬件设计思考

AI妹 3 个月前 15 0

近日，DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文，重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。这篇长达14页的论文不仅

扩展挑战互连带宽联合优化硬件与模型架构硬件架构硬件感知模型设计

查看详情

DeepSeek发布DeepSeek-V3技术论文探讨大模型扩展挑战与硬件架构思考

DeepSeek发布DeepSeek-V3技术论文探讨大模型扩展挑战与硬件架构思考

AI妹 3 个月前 14 0

近日，DeepSeek 團隊發佈了關於其最新模型 DeepSeek-V3的一篇技術論文，重點討論了在大規模人工智能模型訓練中遇到的 “擴展挑戰” 以及與硬件架構相關的思考。這篇長達14頁的論文不僅

DeepSeek团队推理速度优化技术论文 NVIDIA H800 GPU集群大规模人工智能模型训练

查看详情

Omni-R1音频问答模型：基于Qwen2.5-Omni+GRPO优化，创MMAU新纪录文本推理关键

Omni-R1音频问答模型：基于Qwen2.5-Omni+GRPO优化，创MMAU新纪录文本推理关键

AI妹 3 个月前 13 0

最近，一项来自 MIT CSAIL、哥廷根大学、IBM 研究所等机构的研究团队提出了一个名为 Omni-R1的全新音频问答模型。该模型在 Qwen2.5-Omni 的基础上，通过一种名为 GRPO

内存效率 ChatGPT生成数据集多模态任务 AVQA-GPT 强化学习

查看详情



资讯姬

文章数量11972

总阅读量198.508k

总评论量0

会员数量2

本站由emlog驱动