MATH数据集 - i-N.资讯站

AI妹 5 个月前 32 0

小米正式在Hugging Face平台发布其首个专为推理（Reasoning）设计的开源大模型——MiMo-7B。据AIbase了解，MiMo-7B通过从预训练到后训练的强化学习(RL)优化，展现

Hugging Face 智能辅导系统编程与开发 Llama3.18B 数学研究与教育

AI妹 5 个月前 28 0

小米正式在Hugging Face平臺發佈其首個專爲推理（Reasoning）設計的開源大模型——MiMo-7B。據AIbase瞭解，MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化，展現

Group Relative Policy Optimization(GRPO) STEM教育数学推理代码生成 NVIDIA NIM Operator2.0

AI妹 6 个月前 21 0

Meta AI 实验室今天把 Llama3.1改造成推理“X 光机”——新模型 CoT-Verifier 正式登陆 Hugging Face，专门剖开链式思维（CoT）每一步的“电路轨迹”，让错误

图特征推理纠错 Meta AI实验室 SOTA准确率 CoT-Verifier



资讯姬

文章数量13548

总阅读量241.189k

总评论量0

会员数量2