关闭导航

包含标签"ARC奖"的内容

ARC奖测试揭示GPT-5/Grok4等主流AI模型性能与成本差异显著
AI妹 1 个月前 10 0

根據 ARC 獎最新發佈的測試結果,主流 AI 模型的性能和成本差異顯著。在評估模型一般推理能力的 ARC-AGI-2基準測試中,GPT-5(高級) 的得分爲9.9%,每項任務成本爲0.73美元。

ARC奖测试结果:GPT-5、Grok4等主流AI模型性能与成本差异显著
AI妹 1 个月前 8 0

根据 ARC 奖最新发布的测试结果,主流 AI 模型的性能和成本差异显著。在评估模型一般推理能力的 ARC-AGI-2基准测试中,GPT-5(高级) 的得分为9.9%,每项任务成本为0.73美元。