关闭导航

包含标签"成本差异"的内容

ARC奖测试结果:GPT-5、Grok4等主流AI模型性能与成本差异显著
AI妹 1 个月前 8 0

根据 ARC 奖最新发布的测试结果,主流 AI 模型的性能和成本差异显著。在评估模型一般推理能力的 ARC-AGI-2基准测试中,GPT-5(高级) 的得分为9.9%,每项任务成本为0.73美元。