关闭导航

包含标签"NVIDIA H800 GPU集群"的内容

DeepSeek发布最新V3模型技术论文 探讨大模型扩展挑战与硬件设计思考
AI妹 1 个月前 9 0

近日,DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文,重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。这篇长达14页的论文不仅

DeepSeek发布DeepSeek-V3技术论文 探讨大模型扩展挑战与硬件架构思考
AI妹 1 个月前 8 0

近日,DeepSeek 團隊發佈了關於其最新模型 DeepSeek-V3的一篇技術論文,重點討論了在大規模人工智能模型訓練中遇到的 “擴展挑戰” 以及與硬件架構相關的思考。這篇長達14頁的論文不僅

Kimi K2技术报告揭秘:创新训练方法助其登顶全球开源模型竞赛
AI妹 1 个月前 10 0

Recently, the Kimi team officially released the technical report of Kimi K2, revealing the trainin

Kimi K2技术报告发布:万亿参数激活320亿,开源竞赛夺冠创新训练法
AI妹 1 个月前 10 0

近日,Kimi 团队正式发布了 Kimi K2的技术报告,揭示了这款全新模型背后的训练秘密。Kimi K2的参数总量达到1万亿,而激活参数则高达320亿,凭借其强大的能力,Kimi K2在刚上线一

Kimi K2技术报告发布 创新训练方法助力斩获全球开源模型竞赛桂冠
AI妹 1 个月前 9 0

近日,Kimi 團隊正式發佈了 Kimi K2的技術報告,揭示了這款全新模型背後的訓練祕密。Kimi K2的參數總量達到1萬億,而激活參數則高達320億,憑藉其強大的能力,Kimi K2在剛上線一