关闭导航

包含标签"DROP"的内容

DeepSeek架构优化研究:无需堆参数大幅提升大模型推理且成本低
AI妹 16 天前 7 0

近日,知名 AI 实验室 DeepSeek 发表了一项极具影响力的研究论文,揭示了通过优化神经网络架构而非仅仅增加模型规模,也能大幅提升大语言模型的推理表现。这一