强化学习 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"强化学习"的内容

中美科技竞争加剧美国顶尖AI研究员Alex Lamb加盟清华大学

中美科技竞争加剧美国顶尖AI研究员Alex Lamb加盟清华大学

AI妹 5 个月前 20 0

在中美科技競爭加劇的背景下，中國清華大學成功吸引了一位來自美國的頂尖人工智能（AI）研究員 —— 亞歷克斯・蘭博(Alex Lamb)。他曾在微軟研究院擔任高級研究員，現已確認將在即將到來的秋季學

清華大學約书亚・本吉奥谷歌脑美国科技限制 Alex Lamb

查看详情

Grok3.5下周开放测试推理突破多模态升级挑战Gemini与GPT

Grok3.5下周开放测试推理突破多模态升级挑战Gemini与GPT

AI妹 5 个月前 19 0

2025 年 4 月 29 日，AIbase报道——xAI旗下人工智能聊天机器人Grok即将迎来重大更新，其最新版本Grok 3. 5 预计将于下周向SuperGrok订阅用户开放早期测试版。这一

技术问题解答 Grok 3.5 合成数据训练第一性原理全球化布局

查看详情

小米2025年4月开源推理大模型Xiaomi MiMo7B参数性能领先竞品

（注：标题共24字，涵盖核心信息：主体小米、时间节点、事件开源、模型名、参数及优势）

小米2025年4月开源推理大模型Xiaomi MiMo7B参数性能领先竞品（注：标题共24字，涵盖核心信息：主体小米、时间节点、事件开源、模型名、参数及优势）

AI妹 5 个月前 14 0

2025年4月30日，小米公司宣布开源其首个为推理（Reasoning）而生的大模型「Xiaomi MiMo」。这一模型的发布标志着小米在人工智能领域迈出了重要的一步，特别是在推理能力的提升上取得

强化学习 Xiaomi MiMo 数学推理 HuggingFace Easy Data Re-Sampling策略

查看详情

小米2025年4月开源推理大模型MiMo-7B 性能领先多款同/大参数模型

小米2025年4月开源推理大模型MiMo-7B 性能领先多款同/大参数模型

AI妹 5 个月前 16 0

2025年4月30日，小米公司宣佈開源其首個爲推理（Reasoning）而生的大模型「Xiaomi MiMo」。這一模型的發佈標誌着小米在人工智能領域邁出了重要的一步，特別是在推理能力的提升上取得

AIME24-25 代码竞赛推理大模型 LiveCodeBench v5 Easy Data Re-Sampling策略

查看详情

小米发布首个针对推理的开源大模型MiMo 性能超同类全系列开源

小米发布首个针对推理的开源大模型MiMo 性能超同类全系列开源

AI妹 5 个月前 17 0

全球知名科技公司小米正式发布其首个针对推理（Reasoning）而生的大型开源模型 ——Xiaomi MiMo。该模型旨在解决当前预训练模型在推理能力上的瓶颈，探索如何更有效地激发模型的推理潜能。

数学推理 AGI 预训练通用人工智能后训练

查看详情

小米推出開源推理大模型MiMo 7億參數性能領先同類模型

小米推出開源推理大模型MiMo 7億參數性能領先同類模型

AI妹 5 个月前 18 0

全球知名科技公司小米正式發佈其首個針對推理（Reasoning）而生的大型開源模型 ——Xiaomi MiMo。該模型旨在解決當前預訓練模型在推理能力上的瓶頸，探索如何更有效地激發模型的推理潛能。

无缝回放系统小米通用人工智能代码竞赛推理模型

查看详情

小米MiMo-7B开源推理大模型：轻量架构强化学习性能超32B模型

小米MiMo-7B开源推理大模型：轻量架构强化学习性能超32B模型

AI妹 5 个月前 28 0

小米正式在Hugging Face平臺發佈其首個專爲推理（Reasoning）設計的開源大模型——MiMo-7B。據AIbase瞭解，MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化，展現

多语言支持通用推理 Hugging Face Codeforces 数学推理

查看详情

智谱AI GLM-4.5开源发布：SOTA性能、MoE架构、高性价比助力Agent应用

（注：标题涵盖核心主体、关键特性及应用方向，符合30字左右要求，突出模型亮点）

智谱AI GLM-4.5开源发布：SOTA性能、MoE架构、高性价比助力Agent应用（注：标题涵盖核心主体、关键特性及应用方向，符合30字左右要求，突出模型亮点）

AI妹 5 个月前 16 0

Zhipu AI officially launched the next-generation flagship model GLM-4.5 today. This is a foundatio

MIT license Hugging Face Zhipu AI AGI 代码智能体框架

查看详情

微软发布Phi-4系列推理新模型轻量高效适配移动性能可媲美大模型

微软发布Phi-4系列推理新模型轻量高效适配移动性能可媲美大模型

AI妹 5 个月前 18 0

微軟正積極擴展其Phi系列緊湊型語言模型，最新發佈了三款專爲高級推理任務設計的新變體:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reaso

Copilot+ PC 高级推理任务 Windows系统优化微软 38亿参数

查看详情

360智脑3-7B模型开源升级免费商用数学科学等领域表现佳

360智脑3-7B模型开源升级免费商用数学科学等领域表现佳

AI妹 5 个月前 20 0

360集团宣布开源升级了自研的7B参数模型360Zhinao3-7B，并已上线Github开源社区，可供免费商用。这一模型不仅在数学和科学领域表现出色，更在通用能力上展现了强大的潜力，尤其在端侧应

增量训练蒸馏通用能力指令遵循 700B高质量token

查看详情

...

7

...



资讯姬

文章数量13543

总阅读量238.009k

总评论量0

会员数量2

本站由emlog驱动