关闭导航

包含标签"Qwen-2.5-VL-7B"的内容

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点
AI妹 1 个月前 10 0

【研究顛覆】 清華大學與上海交通大學聯合發表的最新論文,對業界普遍認爲"純強化學習(RL)能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現,引入強化學習的模型在某些任務中的表現,反而遜色於

清华上交联合研究挑战传统认知:纯RL难增强大模型推理能力学界热议
AI妹 1 个月前 10 0

【Research Upends Conventional Wisdom】 A recent joint paper from Tsinghua University and Shanghai