关闭导航

包含标签" SWE-bench Verified"的内容

Kimi K2开源模型编程能力接近闭源 低成本高性价比成编码优选
AI妹 1 个月前 8 0

Recently, the Aider Leaderboard released its latest test results, highlighting that Kimi K2, an op

阿里云Qwen3-Coder全面开源 开源模型智能编程表现顶尖
AI妹 1 个月前 6 0

On July 23, Alibaba Cloud officially announced that its latest AI programming large model, Qwen3-C

Mistral AI发布Devstral2编码模型家族及配套Vibe CLI工具
AI妹 1 个月前 16 0

欧洲AI独角兽Mistral AI再度发力,正式发布新一代专为编码设计的开源模型家族Devstral2,包括123B参数的旗舰版Devstral2和24B参数的轻量版Devstral Small2

Claude Opus4.5(Kayak)短暂曝光即删 引发全球AI社区高度关注
AI妹 1 个月前 24 0

AI基准平台Epoch AI页面短暂出现代号“Claude Kayak”的新模型条目,标注发布时间正是今日,随即被删除,引发全球AI社区高度关注。 业内普遍认为,“Claude Kayak”即A