关闭导航

包含标签"SWE-Bench Pro"的内容

智谱发布GLM-5.1提价对齐国际顶尖 技术破纪录股价大涨
AI妹 7 天前 1 0

近日,智谱正式发布全新大模型GLM-5.1。伴随新品上线,模型聚合平台OpenRouter监测显示,智谱GLM全线提价10%。此次调价后,GLM-5.1在Coding(编程)等核心场景的缓存命中T

OpenAI GPT-5.3-Codex全球开放 融合编程与推理性能提升25%
AI妹 1 个月前 2 0

继本月初小范围测试后,OpenAI 旗下的编程大模型 GPT-5.3-Codex 现已正式面向全球开发者全线开放。现在,所有用户均可通过 OpenAI API 官方平台或 OpenRouter 等

OpenAI推出GPT-5.3-Codex编程模型 性能效率安全全面升级
AI妹 2 个月前 93 0

OpenAI 首席执行官 Sam Altman 正式宣布推出全新编程大模型 GPT-5.3-Codex 。作为 Codex 系列的最新迭代版本,该模型在技术指标与

微软推送GPT-5.2:性能飞跃,Copilot迈入深度逻辑推理时代
AI妹 3 个月前 14 0

| 微软今日宣布正式向网页、Windows 及移动端用户推送 OpenAI 迄今为止最强大的模型系列——GPT-5.2。作为一次极具诚意的免费升级,GPT-5.2将以“智能增强版”模式与现有的 G

OpenAI推出GPT-5.2-Codex 开启AI全流程自主编程新纪元
AI妹 3 个月前 17 0

OpenAI今日正式推出其迄今最先进的智能体编程模型——GPT-5.2-Codex,标志着AI在软件工程领域的实战能力迈入新纪元。该模型专为解决复杂、长周期的现实世界编码任务而设计,不仅在权威基准

GPT-5.2-Codex发布:智能代编码里程碑,软件工程与网络安全能力跃升
AI妹 3 个月前 16 0

根据 AIbase 报道,智能代编码领域今日迎来里程碑式进展:GPT‑5.2-Codex 正式发布。作为目前最前沿的智能体编码模型,GPT‑5.2-Codex 基于 GPT‑5.2架构进行了深度专