关闭导航

包含标签"能力与效率"的内容

清华交大研究反驳纯RL提升大模型推理能力 实验揭示关键局限
AI妹 1 个月前 10 0

【研究颠覆】 清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于