关闭导航

包含标签"有效精度率(EAcc)"的内容

ModelScope社区发布UGMathBench动态大学数学推理评估基准数据集
AI妹 1 个月前 9 0

最近、魔ま搭ModelScopeコミュニティは、言語モデルの大学レベルの数学における数学推論能力を包括的に評価するためのUGMathBenchと呼ばれる動的なベンチマークデータセットを発表しました