关闭导航

包含标签"視覚パズルゲーム"的内容

ARC賞最新テスト結果:GPT-5/Grok4等AIモデルの性能とコスト比較
AI妹 1 个月前 8 0

ARC賞の最新テスト結果によると、主流のAIモデルの性能とコストの差は顕著である。一般推論能力を評価するARC-AGI-2ベンチマークテストにおいて、GPT-5(上級)のスコアは9.9%で、1つの