关闭导航

包含标签"報酬信号"的内容

Kimina-Prover数学定理证明模型开源 性能超现有最佳达80.7%
AI妹 1 个月前 9 0

Kimi技術チームは先日、Kimina-Proverプレビュー版の技術レポートを発表し、1.5Bと7Bパラメーターのモデル蒸留版、データ生成用のKimina-Autoformalizer-7Bモデ

「Qwen2.5数学高スコアの疑問:データ汚染による記憶か真の推論か」
AI妹 1 个月前 10 0

国外メディアの報道によると、最新の研究ではアリババのQwen2.5モデルが得た高い数学スコアに疑問を投げかけており、その見かけ上の優れた数学的推論能力が、実際に推論によるものではなく、訓練データへ