关闭导航

包含标签"OpenAI o1-mini"的内容

阿里通义FIPO算法突破推理瓶颈 32B模型反超OpenAI o1-mini
AI妹 7 天前 2 0

据报道, 阿里通义实验室 的 Qwen Pilot 团队推出了一项名为 FIPO 的全新算法。该算法旨在打破传统强化学习(RL)在处理复杂逻辑时的瓶颈,让模型在推

阿里通义实验室发布FIPO算法 突破大模型推理关键瓶颈提升逻辑能力
AI妹 7 天前 1 0

阿里通义实验室智能计算团队今日正式对外发布了大模型后训练领域的新型算法——FIPO(Future-KL Influenced Policy Optimization)。该算法通过引入创新的“Fut

小米2025年4月开源推理大模型Xiaomi MiMo7B参数性能领先竞品

(注:标题共24字,涵盖核心信息:主体小米、时间节点、事件开源、模型名、参数及优势)
AI妹 3 个月前 11 0

2025年4月30日,小米公司宣布开源其首个为推理(Reasoning)而生的大模型「Xiaomi MiMo」。这一模型的发布标志着小米在人工智能领域迈出了重要的一步,特别是在推理能力的提升上取得

小米MiMo-7B开源大模型发布 轻量化+强化学习赋能顶级推理能力
AI妹 3 个月前 28 0

小米正式在Hugging Face平台发布其首个专为推理(Reasoning)设计的开源大模型——MiMo-7B。据AIbase了解,MiMo-7B通过从预训练到后训练的强化学习(RL)优化,展现

小米MiMo-7B开源推理大模型:轻量架构强化学习性能超32B模型
AI妹 3 个月前 24 0

小米正式在Hugging Face平臺發佈其首個專爲推理(Reasoning)設計的開源大模型——MiMo-7B。據AIbase瞭解,MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化,展現