关闭导航

包含标签"V3模型"的内容

中国AI初创公司DeepSeek发布6710亿参数开源数学推理模型掀全球AI热潮
AI妹 1 个月前 9 0

中國 AI 初創公司 DeepSeek 再次掀起開源 AI 領域的熱潮,正式發佈其最新開源模型 DeepSeek-Prover-V2-671B。這一擁有6710億參數的超大規模語言模型,專爲數學推

DeepSeek发布大模型训练端到端技术论文 涵盖软硬件混合优化彰显工程实力
AI妹 1 个月前 10 0

近日,DeepSeek发布了一篇关于大模型训练的最佳端到端技术论文,引发业界广泛关注。该论文全面阐述了DeepSeek在大模型研发中的技术突破,涵盖软件、硬件及混合优化方案,展现了其令人惊叹的工程

DeepSeek发布大模型训练端到端技术论文 软硬件混合优化显创新实力
AI妹 1 个月前 7 0

近日,DeepSeek發佈了一篇關於大模型訓練的最佳端到端技術論文,引發業界廣泛關注。該論文全面闡述了DeepSeek在大模型研發中的技術突破,涵蓋軟件、硬件及混合優化方案,展現了其令人驚歎的工程