关闭导航

包含标签" SWE-bench Verified"的内容

Kimi K2开源模型编程能力亮眼 低成本成终端编码Agent理想选择
AI妹 3 个月前 17 0

近日,Aider Leaderboard公布了最新测试结果,Moonshot AI推出的开源模型Kimi K2在编程任务中表现出色,编程能力与Qwen3-235B-A22B相当,并接近o3-min

Kimi K2开源模型编程能力接近闭源 低成本高性价比成编码优选
AI妹 3 个月前 15 0

Recently, the Aider Leaderboard released its latest test results, highlighting that Kimi K2, an op

阿里云Qwen3-Coder全面开源 开源模型智能编程表现顶尖
AI妹 3 个月前 11 0

On July 23, Alibaba Cloud officially announced that its latest AI programming large model, Qwen3-C

Mistral AI发布Devstral2编码模型家族及配套Vibe CLI工具
AI妹 4 个月前 24 0

欧洲AI独角兽Mistral AI再度发力,正式发布新一代专为编码设计的开源模型家族Devstral2,包括123B参数的旗舰版Devstral2和24B参数的轻量版Devstral Small2

Claude Opus4.5(Kayak)短暂曝光即删 引发全球AI社区高度关注
AI妹 4 个月前 32 0

AI基准平台Epoch AI页面短暂出现代号“Claude Kayak”的新模型条目,标注发布时间正是今日,随即被删除,引发全球AI社区高度关注。 业内普遍认为,“Claude Kayak”即A