关闭导航

包含标签" FrontierMath"的内容

OpenAI o3模型基准测试与宣称存差异 市场反响未受影响且将推更强版本
AI妹 1 个月前 9 0

Recently, OpenAI's o3 AI model has sparked controversy due to discrepancies between its benchmark

OpenAI o3模型基准测试引广泛争议 独立测试得分远低于官方宣称的25%且版本有别
AI妹 1 个月前 8 0

近日,OpenAI 推出的 o3人工智能模型在基準測試中的表現引發了廣泛爭議。儘管 OpenAI 在去年12月首次發佈 o3時自信地宣稱該模型在極具挑戰性的 FrontierMath 數學問題集上