关闭导航

包含标签"SWE-bench Verified"的内容

法国Mistral开源240亿参数Devstral模型 低资源部署编程能力超GPT-4.1-mini
AI妹 1 个月前 9 0

法国初创公司 Mistral 再次引发关注,他们与开源团队 All Hands AI 合作推出了全新语言模型 Devstral。这一模型不仅拥有240亿个参数,而且所需的计算资源显著低于许多同类产

法国Mistral推出240亿参开源Devstral 低资源易部署编程性能领先同类模型
AI妹 1 个月前 9 0

法國初創公司 Mistral 再次引發關注,他們與開源團隊 All Hands AI 合作推出了全新語言模型 Devstral。這一模型不僅擁有240億個參數,而且所需的計算資源顯著低於許多同類產

中国Moonshot AIのKimi K2、OpenRouterでGrok4/GPT-4.1超えAI界注目集める
AI妹 1 个月前 11 0

中国スタートアップ企業のMoonshot AIが開発したオープンソースの大規模言語モデル「Kimi K2」は、OpenRouterプラットフォームでのトークン使用量(市場シェア指標)で急速に上昇し

Moonshot AI开源模型Kimi K2在OpenRouter超越Grok4等引行业关注
AI妹 1 个月前 9 0

来自中国初创公司 Moonshot AI 的开源大语言模型 Kimi K2在 OpenRouter 平台的 token 消耗量(市场份额指标)上迅速攀升,超越 xAI 的 Grok4和 OpenA

Moonshot AI开源模型Kimi K2在OpenRouter超越Grok4及GPT-4.1引关注
AI妹 1 个月前 9 0

來自中國初創公司 Moonshot AI 的開源大語言模型 Kimi K2在 OpenRouter 平臺的 token 消耗量(市場份額指標)上迅速攀升,超越 xAI 的 Grok4和 OpenA

Kimi K2编程能力登Aider前列 低成高性引开源领域热议
AI妹 1 个月前 11 0

最近、Aider Leaderboardは最新のテスト結果を発表し、Moonshot AIがリリースしたオープンソースモデルであるKimi K2がプログラミングタスクで優れたパフォーマンスを示しま

Kimi K2开源模型编程能力亮眼 低成本成终端编码Agent理想选择
AI妹 1 个月前 9 0

近日,Aider Leaderboard公佈了最新測試結果,Moonshot AI推出的開源模型Kimi K2在編程任務中表現出色,編程能力與Qwen3-235B-A22B相當,並接近o3-min

阿里云Qwen3-Coder AI编程大模型开源 能力达开源顶尖水平
AI妹 1 个月前 11 0

7月23日,阿里雲正式宣佈其最新的AI編程大模型Qwen3-Coder全面開源,這一舉措迅速在智能編程領域掀起熱潮。Qwen3-Coder憑藉其卓越的代碼生成和Agent能力,在Agentic C

Mistral AI发布Devstral2系列开源编码模型 性能刷新纪录工具同步开源
AI妹 1 个月前 14 0

Mistral AI 正式推出第二代开源编码模型家族:Devstral2(1230亿参数旗舰版)与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verif

Mistral AI发布新一代Devstral2系列编码模型及Mistral Vibe开源工具
AI妹 1 个月前 13 0

近日,Mistral AI 正式发布了其第二代开源编码模型家族,分别命名为 Devstral2和 Devstral Small2。这两款新模型不仅在性能上取得了显著进展,而且在许可策略上也进行了差