关闭导航

包含标签"真实推理能力"的内容

研究质疑Qwen2.5数学高分源于记忆而非推理,数据污染成关键
AI妹 1 个月前 13 0

据国外媒体报道, 一项最新研究对阿里巴巴Qwen2.5模型的高数学分数提出了质疑,指出其看似卓越的数学推理能力,可能主要来源于对训练数据的记忆,而非真正的推理。研究人员通过一系列严谨的测试发现,数