推理能力评估体系

AI妹 5 个月前 16 0

【研究顛覆】清華大學與上海交通大學聯合發表的最新論文，對業界普遍認爲"純強化學習（RL）能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現，引入強化學習的模型在某些任務中的表現，反而遜色於

视觉推理能力调控器 HumanEval+ 大模型推理能力 Qwen-2.5-VL-7B

AI妹 5 个月前 18 0

【Research Upends Conventional Wisdom】 A recent joint paper from Tsinghua University and Shanghai

清华大学强化学习 GSM8K 能力调节器数学任务

AI妹 5 个月前 16 0

【研究颠覆】清华大学与上海交通大学联合发表的最新论文，对业界普遍认为"纯强化学习（RL）能提升大模型推理能力"的观点提出了挑战性反驳。研究发现，引入强化学习的模型在某些任务中的表现，反而逊色于

强化学习上海交通大学大模型推理能力评估体系能力与效率



资讯姬

文章数量13538

总阅读量234.948k

总评论量0

会员数量2