刷分 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"刷分"的内容

METR测试中Claude Opus4.5刷新AI超长复杂任务处理时长纪录

METR测试中Claude Opus4.5刷新AI超长复杂任务处理时长纪录

AI妹 5 个月前 21 0

在追求大模型“高智商”的同时，AI 的持续执行能力正成为衡量其进化水平的新维度。根据人工智能研究机构 METR 发布的最新基准测试，Anthropic 旗下的顶级

基准测试 AI进化水平成功率样本误差局限性

查看详情



资讯姬

文章数量13548

总阅读量241.189k

总评论量0

会员数量2

本站由emlog驱动