关闭导航

包含标签" Epoch研究所"的内容

OpenAI o3模型基准测试引广泛争议 独立测试得分远低于官方宣称的25%且版本有别
AI妹 1 个月前 8 0

近日,OpenAI 推出的 o3人工智能模型在基準測試中的表現引發了廣泛爭議。儘管 OpenAI 在去年12月首次發佈 o3時自信地宣稱該模型在極具挑戰性的 FrontierMath 數學問題集上