关闭导航

包含标签"SWE-bench"的内容

字节Seed团队开源Seed-Coder:8B参数创新范式树编程新标杆
AI妹 1 个月前 9 0

字节跳动Seed团队正式推出全新开源代码模型Seed-Coder,以其卓越的代码生成、补全、编辑及推理能力引发业界广泛关注。作为一款8B参数规模的模型,Seed-Coder在多个基准测试中超越同级

字节跳动Seed团队开源Seed-Coder:8B参数代码模型性能领先同级
AI妹 1 个月前 10 0

字節跳動Seed團隊正式推出全新開源代碼模型Seed-Coder,以其卓越的代碼生成、補全、編輯及推理能力引發業界廣泛關注。作爲一款8B參數規模的模型,Seed-Coder在多個基準測試中超越同級

OpenAI发布GPT-5系列模型 性能刷新多项基准纪录迈向AGI重要一步
AI妹 1 个月前 9 0

北京时间今天凌晨1点,OpenAI 公司正式宣布推出 GPT-5模型。OpenAI 首席执行官山姆・奥尔特曼在发布会上宣称,这是迈向通用人工智能(AGI)的重要一步,与 GPT-5交流,就如同和人

GPT-5、Claude4Opus与Gemini2.5Pro性能功能场景定价对比评测
AI妹 1 个月前 9 0

8月7日,OpenAI正式发布GPT-5,这标志着大语言模型进入了全新的发展阶段。那么,GPT-5性能究竟如何?和Claude4Opus、Gemini2.5Pro对比,谁更强呢? 接下来的评测将

2025年GPT-5、Claude4Opus与Gemini2.5Pro三大AI模型詳細対比分析
AI妹 1 个月前 9 0

核心ポイント:2025年8月、AI分野は新たな重要な節目を迎えました。OpenAIが公開したGPT-5、AnthropicのClaude4Opus、GoogleのGemini2.5Proは現在の巨

OpenAI发布Codex云基AI编程代理 开启AI辅助编程新时代
AI妹 1 个月前 10 0

Today, OpenAI released a groundbreaking new cloud-based AI programming agent called Codex during a

OpenAI发布Codex云AI编程智能体 开启AI编程效率革命新时代
AI妹 1 个月前 9 0

OpenAI在今日的線上直播中震撼發佈了一款全新的雲端AI編程智能體——Codex,標誌着AI編程新時代的正式開啓。由Greg Brockman帶領的OpenAI六人團隊向全球展示了這一強大工具,

OpenAI发布云AI编程助手Codex 搭载全新模型开启AI编程新时代
AI妹 1 个月前 9 0

OpenAIは本日のオンラインライブ配信で、新たなクラウドAIプログラミングエージェントであるCodexを驚くべき発表を行い、AIプログラミングの新时代が幕を開けました。Greg Brockman

Anthropic推出Claude4系列模型 编程能力卓越获开发者青睐
AI妹 1 个月前 10 0

最近,人工智能界传来重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。这次发布并没有华丽的口号或冗长的论文,关键词

Anthropic推出Claude4系列模型 强化编程能力与实用功能
AI妹 1 个月前 8 0

最近,人工智能界傳來重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。這次發佈並沒有華麗的口號或冗長的論文,關鍵詞