SWE-bench Verified - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签" SWE-bench Verified"的内容

Kimi K2开源模型编程能力亮眼低成本成终端编码Agent理想选择

Kimi K2开源模型编程能力亮眼低成本成终端编码Agent理想选择

AI妹 5 个月前 19 0

近日，Aider Leaderboard公布了最新测试结果，Moonshot AI推出的开源模型Kimi K2在编程任务中表现出色，编程能力与Qwen3-235B-A22B相当，并接近o3-min

Claude Code环境代码生成 Hugging Face Moonshot AI Aider Leaderboard

查看详情

Kimi K2开源模型编程能力接近闭源低成本高性价比成编码优选

Kimi K2开源模型编程能力接近闭源低成本高性价比成编码优选

AI妹 5 个月前 19 0

Recently, the Aider Leaderboard released its latest test results, highlighting that Kimi K2, an op

Moonshot AI web generation open-source model LiveCodeBench Kimi K2

查看详情

阿里云Qwen3-Coder全面开源开源模型智能编程表现顶尖

阿里云Qwen3-Coder全面开源开源模型智能编程表现顶尖

AI妹 5 个月前 14 0

On July 23, Alibaba Cloud officially announced that its latest AI programming large model, Qwen3-C

SWE-bench Verified MoE architecture 256K context length 35B activated parameters Alibaba Cloud BaiLian platform

查看详情

Mistral AI发布Devstral2编码模型家族及配套Vibe CLI工具

Mistral AI发布Devstral2编码模型家族及配套Vibe CLI工具

AI妹 5 个月前 27 0

欧洲AI独角兽Mistral AI再度发力，正式发布新一代专为编码设计的开源模型家族Devstral2，包括123B参数的旗舰版Devstral2和24B参数的轻量版Devstral Small2

分布式智能密集Transformer架构本地运行开源Agent平台代码库探索

查看详情

Claude Opus4.5（Kayak）短暂曝光即删引发全球AI社区高度关注

Claude Opus4.5（Kayak）短暂曝光即删引发全球AI社区高度关注

AI妹 6 个月前 35 0

AI基准平台Epoch AI页面短暂出现代号“Claude Kayak”的新模型条目，标注发布时间正是今日，随即被删除，引发全球AI社区高度关注。业内普遍认为，“Claude Kayak”即A

Google Gemini3.0Pro Epoch AI Haiku4.5 代码生成能力 Anthropic

查看详情

4



资讯姬

文章数量13530

总阅读量231.397k

总评论量0

会员数量2

本站由emlog驱动