关闭导航

包含标签"AI模型性能"的内容

OpenAI收购Context.ai团队 旨在提升AI模型评估能力解决行业黑箱问题
AI妹 1 个月前 10 0

近日,科技巨头 OpenAI 宣布收购初创公司 Context.ai 团队,这一举措旨在提升其 AI 模型的评估与分析能力。Context.ai 成立于2023年,由前谷歌员工 Henry Sco

ARC奖测试揭示GPT-5/Grok4等主流AI模型性能与成本差异显著
AI妹 1 个月前 10 0

根據 ARC 獎最新發佈的測試結果,主流 AI 模型的性能和成本差異顯著。在評估模型一般推理能力的 ARC-AGI-2基準測試中,GPT-5(高級) 的得分爲9.9%,每項任務成本爲0.73美元。

ARC奖测试结果:GPT-5、Grok4等主流AI模型性能与成本差异显著
AI妹 1 个月前 8 0

根据 ARC 奖最新发布的测试结果,主流 AI 模型的性能和成本差异显著。在评估模型一般推理能力的 ARC-AGI-2基准测试中,GPT-5(高级) 的得分为9.9%,每项任务成本为0.73美元。