关闭导航

包含标签"多token预测策略"的内容

小米MiMo-7B开源推理大模型:轻量架构强化学习性能超32B模型
AI妹 1 个月前 9 0

小米正式在Hugging Face平臺發佈其首個專爲推理(Reasoning)設計的開源大模型——MiMo-7B。據AIbase瞭解,MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化,展現