OpenAI o1-mini - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"OpenAI o1-mini"的内容

阿里通义FIPO算法突破推理瓶颈 32B模型反超OpenAI o1-mini

阿里通义FIPO算法突破推理瓶颈 32B模型反超OpenAI o1-mini

AI妹 2 个月前 3 0

据报道，阿里通义实验室的 Qwen Pilot 团队推出了一项名为 FIPO 的全新算法。该算法旨在打破传统强化学习（RL）在处理复杂逻辑时的瓶颈，让模型在推

OpenAI o1-mini FIPO算法 32B模型 Future-KL机制奖励机制

查看详情

阿里通义实验室发布FIPO算法突破大模型推理关键瓶颈提升逻辑能力

阿里通义实验室发布FIPO算法突破大模型推理关键瓶颈提升逻辑能力

AI妹 2 个月前 3 0

阿里通义实验室智能计算团队今日正式对外发布了大模型后训练领域的新型算法——FIPO（Future-KL Influenced Policy Optimization）。该算法通过引入创新的“Fut

预训练规模推理长度停滞长文本推理阿里通义实验室智能计算团队纯强化学习

查看详情

小米2025年4月开源推理大模型Xiaomi MiMo7B参数性能领先竞品

（注：标题共24字，涵盖核心信息：主体小米、时间节点、事件开源、模型名、参数及优势）

小米2025年4月开源推理大模型Xiaomi MiMo7B参数性能领先竞品（注：标题共24字，涵盖核心信息：主体小米、时间节点、事件开源、模型名、参数及优势）

AI妹 5 个月前 14 0

2025年4月30日，小米公司宣布开源其首个为推理（Reasoning）而生的大模型「Xiaomi MiMo」。这一模型的发布标志着小米在人工智能领域迈出了重要的一步，特别是在推理能力的提升上取得

AIME24-25 Easy Data Re-Sampling策略推理能力 Xiaomi MiMo 7B参数

查看详情

小米MiMo-7B开源大模型发布轻量化+强化学习赋能顶级推理能力

小米MiMo-7B开源大模型发布轻量化+强化学习赋能顶级推理能力

AI妹 5 个月前 31 0

小米正式在Hugging Face平台发布其首个专为推理（Reasoning）设计的开源大模型——MiMo-7B。据AIbase了解，MiMo-7B通过从预训练到后训练的强化学习(RL)优化，展现

推理引擎国际数学奥林匹克(IMO) STEM教育 RL奖励机制 MMLU

查看详情

小米MiMo-7B开源推理大模型：轻量架构强化学习性能超32B模型

小米MiMo-7B开源推理大模型：轻量架构强化学习性能超32B模型

AI妹 5 个月前 27 0

小米正式在Hugging Face平臺發佈其首個專爲推理（Reasoning）設計的開源大模型——MiMo-7B。據AIbase瞭解，MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化，展現

冷启动能力 Tree-of-Thought(ToT) Codeforces MiMo-7B 强化学习

查看详情



资讯姬

文章数量13527

总阅读量229.336k

总评论量0

会员数量2

本站由emlog驱动