关闭导航

包含标签"MATH数据集"的内容

小米MiMo-7B开源大模型发布 轻量化+强化学习赋能顶级推理能力
AI妹 1 个月前 10 0

小米正式在Hugging Face平台发布其首个专为推理(Reasoning)设计的开源大模型——MiMo-7B。据AIbase了解,MiMo-7B通过从预训练到后训练的强化学习(RL)优化,展现

小米MiMo-7B开源推理大模型:轻量架构强化学习性能超32B模型
AI妹 1 个月前 9 0

小米正式在Hugging Face平臺發佈其首個專爲推理(Reasoning)設計的開源大模型——MiMo-7B。據AIbase瞭解,MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化,展現

Meta CoT-Verifier:剖开CoT推理黑箱 诊断纠错并开源
AI妹 1 个月前 15 0

Meta AI 实验室今天把 Llama3.1改造成推理“X 光机”——新模型 CoT-Verifier 正式登陆 Hugging Face,专门剖开链式思维(CoT)每一步的“电路轨迹”,让错误