关闭导航

包含标签"SWE-bench"的内容

mini-SWE-agent:100行代码轻量开源,GitHub项目Bug修复率约65%
AI妹 4 个月前 31 0

在编程界,一个全新的开源项目正在引起热议,那就是由 SWE-bench 和 SWE-agent 的开发团队推出的 mini-SWE-agent。这个项目的亮点在于,它仅需100行代码,就能在真实的

mini-SWE-agent:100行代码搞定65%GitHub真实bug的轻量开源工具
AI妹 4 个月前 23 0

In the programming community, a brand-new open-source project is causing a stir: mini-SWE-agent, d

mini-SWE-agent:100行代码修复65%Bug的轻量开源编程辅助工具
AI妹 4 个月前 16 0

在編程界,一個全新的開源項目正在引起熱議,那就是由 SWE-bench 和 SWE-agent 的開發團隊推出的 mini-SWE-agent。這個項目的亮點在於,它僅需100行代碼,就能在真實的

开源项目mini-SWE-agent:100行代码实现65%bug修复的轻量高效工具
AI妹 4 个月前 14 0

プログラミング界では、SWE-bench と SWE-agent の開発チームがリリースした「mini-SWE-agent」という新しいオープンソースプロジェクトが注目を集めています。このプロジェ

字节Seed团队开源Seed-Coder:8B参数创新范式树编程新标杆
AI妹 4 个月前 13 0

字节跳动Seed团队正式推出全新开源代码模型Seed-Coder,以其卓越的代码生成、补全、编辑及推理能力引发业界广泛关注。作为一款8B参数规模的模型,Seed-Coder在多个基准测试中超越同级

字节跳动Seed团队开源Seed-Coder:8B参数代码模型性能领先同级
AI妹 4 个月前 14 0

字節跳動Seed團隊正式推出全新開源代碼模型Seed-Coder,以其卓越的代碼生成、補全、編輯及推理能力引發業界廣泛關注。作爲一款8B參數規模的模型,Seed-Coder在多個基準測試中超越同級

OpenAI发布GPT-5系列模型 性能刷新多项基准纪录迈向AGI重要一步
AI妹 4 个月前 15 0

北京时间今天凌晨1点,OpenAI 公司正式宣布推出 GPT-5模型。OpenAI 首席执行官山姆・奥尔特曼在发布会上宣称,这是迈向通用人工智能(AGI)的重要一步,与 GPT-5交流,就如同和人

GPT-5、Claude4Opus与Gemini2.5Pro性能功能场景定价对比评测
AI妹 4 个月前 13 0

8月7日,OpenAI正式发布GPT-5,这标志着大语言模型进入了全新的发展阶段。那么,GPT-5性能究竟如何?和Claude4Opus、Gemini2.5Pro对比,谁更强呢? 接下来的评测将

2025年GPT-5、Claude4Opus与Gemini2.5Pro三大AI模型詳細対比分析
AI妹 4 个月前 12 0

核心ポイント:2025年8月、AI分野は新たな重要な節目を迎えました。OpenAIが公開したGPT-5、AnthropicのClaude4Opus、GoogleのGemini2.5Proは現在の巨

OpenAI发布Codex云基AI编程代理 开启AI辅助编程新时代
AI妹 4 个月前 15 0

Today, OpenAI released a groundbreaking new cloud-based AI programming agent called Codex during a