关闭导航

包含标签"长时程任务"的内容

METR测试中Claude Opus4.5刷新AI超长复杂任务处理时长纪录
AI妹 29 天前 8 0

在追求大模型“高智商”的同时,AI 的持续执行能力正成为衡量其进化水平的新维度。根据人工智能研究机构 METR 发布的最新基准测试,Anthropic 旗下的顶级