关闭导航

包含标签"Claude Opus4.5"的内容

GPT-5.2自主编程能力领先Claude,可独立完成大型工程如浏览器构建
AI妹 4 天前 3 0

当AI开始尝试从零构建一个完整的Web浏览器——包括HTML解析器、CSS布局引擎,甚至自研JavaScript虚拟机——它面对的已不仅是代码生成,而是一场对逻辑一致性、任务持久性与工程理解力的极

Cursor内部测试:GPT-5.2在长程编程任务中表现优于Claude Opus4.5
AI妹 4 天前 4 0

知名 AI 编程辅助工具 Cursor 近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时,OpenAI 最新的 GPT-5.2

METR测试中Claude Opus4.5刷新AI超长复杂任务处理时长纪录
AI妹 29 天前 8 0

在追求大模型“高智商”的同时,AI 的持续执行能力正成为衡量其进化水平的新维度。根据人工智能研究机构 METR 发布的最新基准测试,Anthropic 旗下的顶级

研究表明先进AI模型等能发现利用智能合约漏洞亦可强化网络安全
AI妹 1 个月前 16 0

根据 MATS 和 Anthropic 的一项新研究,先进的人工智能模型,如 Claude Opus4.5、Sonnet4.5和 GPT-5,在受控测试中能够发现并利用智能合约中的漏洞。研究团队使

Claude Opus4.5上线亚马逊Bedrock 提升编码办公能力且性价比优越
AI妹 1 个月前 15 0

在人工智能领域,Anthropic 推出了最新的基础模型 ——Claude Opus4.5,该模型现已在亚马逊 Bedrock 平台上提供。亚马逊 Bedrock 是一项完全托管的服务,允许用户选

Anthropic发布Claude Opus4.5:推理对话升级 软件工程能力领跑
AI妹 1 个月前 15 0

Anthropic近日正式发布其迄今为止最强大的AI模型Claude Opus4.5。这一突破性升级标志着AI在推理、对话和软件工程领域的全新巅峰,预计将深刻影响开发者社区和企业级应用。Claud

Anthropic发布Claude Opus4.5 编码Agent能力领先安全高效开放定价明确
AI妹 1 个月前 15 0

人工智能公司 Anthropic 正式发布其最新旗舰模型 Claude Opus4.5。根据公司官方介绍,该模型在编码(coding)、agent(智能代理)操作及电脑使用等关键生产力场景中,已达