关闭导航

包含标签" SWE-bench Verified"的内容

Anthropic发布Claude Opus4.1 编码推理Agent能力升级安全稳定无缝切换
AI妹 1 个月前 9 0

Anthropic 正式发布了其最新旗舰模型 Claude Opus4.1,在 Agent 任务、真实世界编码和推理能力方面实现显著提升。这一版本被定位为 Claude Opus4的直接升级,定价

OpenAI发布GPT-5:技术突破显著 全用户开放 大幅降低幻觉问题
AI妹 1 个月前 8 0

AIBase消息, 2025 年 8 月 8 日,OpenAI正式發佈了其備受矚目的新一代人工智能模型GPT-5。這是自GPT- 4 發佈以來最重要的模型升級,標誌着AI技術發展的又一重要里程碑。

OpenAI发布GPT-5:统一架构突破 幻觉锐减 全用户可享智能升级
AI妹 1 个月前 8 0

AIBase News, August 8, 2025, OpenAI officially released its highly anticipated next-generation art

GPT-5登陆GitHub Copilot 开启AI编程协作新时代
AI妹 1 个月前 10 0

AIBase Message, August 7, 2025, OpenAI announced that its latest flagship model, GPT-5, has offici

GPT-5登陆GitHub Copilot公开预览 开启编程辅助新纪元与微软生态整合
AI妹 1 个月前 10 0

AIBase消息,2025年8月7日,OpenAI宣布其最新旗舰模型GPT-5正式在GitHub Copilot中开启公开预览,这标志着AI编程辅助工具迎来革命性升级。此次集成紧随GPT-5向

OpenAI发布GPT-5:技术升级、多版本定价及行业反响综述
AI妹 1 个月前 10 0

AIBase | August 8, 2025 report On August 7, 2025, OpenAI officially released its latest generat

GPT-5登陆GitHub Copilot公开预览 编程辅助迎来革命性升级
AI妹 1 个月前 8 0

AIBase消息,2025年8月7日,OpenAI宣佈其最新旗艦模型GPT-5正式在GitHub Copilot中開啓公開預覽,這標誌着AI編程輔助工具迎來革命性升級。此次集成緊隨GPT-5向

Anthropic Claude4系列将发布:思维与工具动态切换引行业热议
AI妹 1 个月前 7 0

Anthropic's next-generation AI models, Claude4Sonnet and Claude4Opus, are set to launch soon, spar

Mistral推出2400万参Devstral开源轻量模型 SWE-Bench领先超闭源成代码代理最佳开源工具
AI妹 1 个月前 7 0

法國人工智能模型製造商 Mistral 在因其最新閉源模型 Medium3受到部分開源社區批評後,迅速回歸開源路線。該公司近日與開源初創公司 All Hands AI(OpenDevin 的創建者