关闭导航

包含标签"推论能力评价系统"的内容

清华上交研究质疑RL提升大语言模型推理能力 引发学界广泛讨论
AI妹 1 个月前 11 0

【研究の転換点】 清華大学と上海交通大学が共同発表した最新の論文は、業界で広く信じられている「純粋な強化学習(RL)は大規模言語モデルの推論能力を向上させる」という見解に異議を唱えています。研