关闭导航

包含标签"SWE-bench Verified"的内容

Anthropic发布Claude Opus4.1 编程推理性能显著提升且安全稳健
AI妹 1 个月前 11 0

今日,人工智能公司Anthropic正式发布其旗舰模型Claude Opus4的升级版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任务、真实世界编程和推理能力,尤其是

Anthropic发布Claude Opus4.1 编码推理Agent能力升级且安全稳定
AI妹 1 个月前 9 0

Anthropic 正式發佈了其最新旗艦模型 Claude Opus4.1,在 Agent 任務、真實世界編碼和推理能力方面實現顯著提升。這一版本被定位爲 Claude Opus4的直接升級,定價

Anthropic推Claude Opus4.1 代码/推理/安全能力均获显著提升
AI妹 1 个月前 12 0

Anthropic は、最新のエクスパートモデル「Claude Opus4.1」を正式にリリースしました。エージェントタスク、現実世界のコード作成および推論能力において顕著な向上を遂げました。この

OpenAI正式発表GPT-5:全ユーザー段階公開、各分野性能躍進
AI妹 1 个月前 9 0

今朝のライブ配信イベントで、OpenAIは注目を集めるGPT-5モデルを正式に発表しました。このモデルは、同社がこれまでに開発した中でも最も優れたものであり、プログラミング、数学、ライティング、健

OpenAI发布GPT-5:技术突破多,分层开放用户,大幅降低幻觉并革新交互
AI妹 1 个月前 10 0

AIBase消息, 2025 年 8 月 8 日,OpenAI正式发布了其备受瞩目的新一代人工智能模型GPT-5。这是自GPT- 4 发布以来最重要的模型升级,标志着AI技术发展的又一重要里程碑。

GPT-5正式発表:技術突破・ユーザー階層サービス・幻覚大幅低減
AI妹 1 个月前 8 0

AIBaseメッセージ、2025年8月8日、OpenAIは待望の新世代人工知能モデルGPT-5を正式に発表しました。これはGPT-4のリリース以来最大のモデルアップグレードであり、AI技術の進化に

OpenAI发布GPT-5 开放所有用户 更像人类专家多领域能力强
AI妹 1 个月前 10 0

In the live event this early morning, OpenAI officially launched the highly anticipated GPT-5 mode

OpenAI正式发布GPT-5模型 多领域表现顶尖 本周四起向用户开放
AI妹 1 个月前 10 0

在今日凌晨的直播活動中,OpenAI正式推出了備受矚目的GPT-5模型,宣稱其爲自家迄今爲止最出色的模型,在編程、數學、寫作、健康、視覺感知等多個領域均展現出頂尖實力。 OpenAI首席執行

OpenAI正式发布GPT-5模型 面向所有用户开放且多领域实力显著提升
AI妹 1 个月前 10 0

在今日凌晨的直播活动中,OpenAI正式推出了备受瞩目的GPT-5模型,宣称其为自家迄今为止最出色的模型,在编程、数学、写作、健康、视觉感知等多个领域均展现出顶尖实力。 OpenAI首席执行

OpenAI发布GPT-5:解析特性价格版本能力及业界看法汇总
AI妹 1 个月前 11 0

AIBase | 2025年8月8日報道 2025年8月7日,OpenAI正式發佈了其最新一代人工智能模型GPT-5,這一發布標誌着生成式AI領域的又一里程碑。作爲OpenAI迄今爲止最強大