关闭导航

包含标签"数学任务"的内容

清华上交研究质疑RL提升大语言模型推理能力 引发学界广泛讨论
AI妹 1 个月前 11 0

【研究の転換点】 清華大学と上海交通大学が共同発表した最新の論文は、業界で広く信じられている「純粋な強化学習(RL)は大規模言語モデルの推論能力を向上させる」という見解に異議を唱えています。研

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点
AI妹 1 个月前 10 0

【研究顛覆】 清華大學與上海交通大學聯合發表的最新論文,對業界普遍認爲"純強化學習(RL)能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現,引入強化學習的模型在某些任務中的表現,反而遜色於

清华上交联合研究挑战传统认知:纯RL难增强大模型推理能力学界热议
AI妹 1 个月前 10 0

【Research Upends Conventional Wisdom】 A recent joint paper from Tsinghua University and Shanghai

清华交大研究反驳纯RL提升大模型推理能力 实验揭示关键局限
AI妹 1 个月前 10 0

【研究颠覆】 清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于

谷歌Gemini2.5 AI搜索引擎灰度测试 或于I/O大会发布变革搜索体验
AI妹 1 个月前 10 0

随着谷歌I/O开发者大会临近(5月20日至21日),业界传出重磅消息:谷歌正计划推出基于Gemini2.5的下一代AI搜索引擎,全面替换传统的搜索框界面。这一新模式已进入灰度测试阶段,标志着谷歌将

DeepSeek R1-0528发布:128K上下文+强推理编码,免费开放引行业关注
AI妹 1 个月前 8 0

As a pioneer in the AI field, DeepSeek once again sparked industry discussions with its technologi

DeepSeek V3.2系列发布 核心DSA升级性能对标闭源且开源可商用
AI妹 1 个月前 17 0

DeepSeek 发布 V3.2(标准版)与 V3.2-Speciale(深度思考版),官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special