关闭导航

包含标签"SimpleBench常识推理测试"的内容

GPT-5.2专业领域表现超顶尖专家 常识推理短板引发用户争议
AI妹 1 个月前 11 0

在 OpenAI 庆祝十周年之际,最新发布的 GPT-5.2 系列模型引发了广泛讨论。官方数据显示,GPT-5.2 在多个专业基准测试中表现出色,甚至在某些领域超过了人类专家,堪称迄今为止在专业知