关闭导航

包含标签"o3-mini-high"的内容

OpenAI o3模型基准测试引发争议 独立测试得分远低于官方宣称
AI妹 1 个月前 8 0

近日,OpenAI 推出的 o3人工智能模型在基准测试中的表现引发了广泛争议。尽管 OpenAI 在去年12月首次发布 o3时自信地宣称该模型在极具挑战性的 FrontierMath 数学问题集上

OpenAI o3模型独立测试正解率仅10% 远低于自身宣称的25%
AI妹 1 个月前 9 0

最近、OpenAIが発表したo3人工知能モデルのベンチマークテストの結果が、広く議論を呼んでいます。OpenAIは昨年12月にo3を初めて発表した際、非常に難しいFrontierMath数学問題集