关闭导航

包含标签"多头潜注意力(MLA)"的内容

DeepSeek发布6710亿参数开源数学推理模型 推动全球AI研究与应用
AI妹 1 个月前 9 0

中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型,专为数学推