关闭导航

包含标签"RandomCalculationデータセット"的内容

「Qwen2.5数学高スコアの疑問:データ汚染による記憶か真の推論か」
AI妹 1 个月前 10 0

国外メディアの報道によると、最新の研究ではアリババのQwen2.5モデルが得た高い数学スコアに疑問を投げかけており、その見かけ上の優れた数学的推論能力が、実際に推論によるものではなく、訓練データへ