关闭导航

包含标签"吞吐量"的内容

英伟达GB200 NVL72在MoE测试中性能显著超AMD28倍 成本低 AMD稠密模型有竞争力
AI妹 16 天前 7 0

在最新发布的 SemiAnalysis InferenceMAX 基准测试中,Signal65 分析了 Deepseek-R1 0528 混合专家(MoE)模型的推理表现,结果显示英伟达(NVID

英伟达Llama-Nemotron开源模型 推理交互多维度创新突破
AI妹 1 个月前 10 0

近日,英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron,该系列模型不仅在推能力上超越了 DeepSeek-R1,更是在内存效率和吞吐量上实现了显著提升。根据最新发布的技术报告,

英伟达Llama-Nemotron开源模型:推理超竞品 效率内存优且支持128K上下文
AI妹 1 个月前 9 0

近日,英偉達正式推出了其最新開源模型系列 ——Llama-Nemotron,該系列模型不僅在推能力上超越了 DeepSeek-R1,更是在內存效率和吞吐量上實現了顯著提升。根據最新發佈的技術報告,

阶跃星辰Step3基础大模型正式开源 具MoE架构高效推理多模态能力
AI妹 1 个月前 8 0

 階躍星辰團隊宣佈其最新一代基礎大模型 Step3正式開源。Step3是一款專爲追求性能與成本極致均衡的企業和開發者設計的模型,旨在面向推理時代打造最適合應用的模型。該模型的開源地址包括

MiniCPM-V4.0多模态模型正式开源:4B参数端侧流畅同级SOTA
AI妹 1 个月前 9 0

 魔搭ModelScope社区宣布,面壁小钢炮新一代多模态模型MiniCPM-V4.0正式开源。凭借4B参数量,该模型在OpenCompass、OCRBench、MathVista等多个

MiniCPM-V4.0开源:4B参数边缘友好 同级别多模态性能领先

(注:标题共28字,涵盖核心信息:模型名称、开源事件、参数规模、设备特性、性能优势)
AI妹 1 个月前 11 0

 魔搭ModelScopeコミュニティは、面壁小鋼砲の新世代マルチモーダルモデルMiniCPM-V4.0が正式にオープンソース化されたことを発表しました。4Bパラメータの規模で、Open

MiniCPM-V4.0开源:4B参数端侧流畅运行 同级多模性能SOTA
AI妹 1 个月前 9 0

 魔搭ModelScope社區宣佈,面壁小鋼炮新一代多模態模型MiniCPM-V4.0正式開源。憑藉4B參數量,該模型在OpenCompass、OCRBench、MathVista等多個

AIKBase V2.0向量数据库发布 为AI添"数据脑"赋能行业升级
AI妹 1 个月前 8 0

With the rapid development of artificial intelligence technology, data intelligence has become a k

xLLM社区12.6办首届Meetup 共建开源AI Infra生态并展自研引擎
AI妹 1 个月前 14 0

成立仅三个月的xLLM社区宣布将于 12 月 6 日举办首届线下Meetup,主题“共建开源AI Infra生态”。活动将展示自研推理引擎xLLM-Core,公开对比数据:在同级GPU上,MoE、

OpenAI将停GPT-4o API 开发者迁至GPT-5.1系列
AI妹 1 个月前 14 0

OpenAI 近期向其 API 客户发布通知,确认将于 2026 年 2 月 16 日正式停止对 chatgpt-4o-latest 模型的访问。这一决定意味着仍在使用 GPT-4o 开发