关闭导航

包含标签"SWE-bench Verified"的内容

Anthropic初开发者大会发布Claude4系列 激化与OpenAI等的AI竞争
AI妹 4 个月前 13 0

初開発者大会で、Anthropicは「業界最高水準」と称される2つのAIモデルを発表し、OpenAIやGoogleとの競争を激化させました。 Anthropicは木曜日に開催された初の開発者大

Anthropic发布Claude4系列模型 编码推理能力升级 覆盖付费及免费用户
AI妹 4 个月前 15 0

As a pioneer in the field of artificial intelligence, Anthropic officially released the Claude4 se

法国Mistral发布开源Devstral模型 低资源高性能获开发者期待
AI妹 4 个月前 14 0

フランスのスタートアップ企業である Mistral は再び注目を集めています。彼らはオープンソースチーム All Hands AI と協力し、新たな言語モデル「Devstral」をリリースしました

法国Mistral开源240亿参数Devstral模型 低资源部署编程能力超GPT-4.1-mini
AI妹 4 个月前 12 0

法国初创公司 Mistral 再次引发关注,他们与开源团队 All Hands AI 合作推出了全新语言模型 Devstral。这一模型不仅拥有240亿个参数,而且所需的计算资源显著低于许多同类产

法国Mistral推出240亿参开源Devstral 低资源易部署编程性能领先同类模型
AI妹 4 个月前 16 0

法國初創公司 Mistral 再次引發關注,他們與開源團隊 All Hands AI 合作推出了全新語言模型 Devstral。這一模型不僅擁有240億個參數,而且所需的計算資源顯著低於許多同類產

中国Moonshot AIのKimi K2、OpenRouterでGrok4/GPT-4.1超えAI界注目集める
AI妹 4 个月前 14 0

中国スタートアップ企業のMoonshot AIが開発したオープンソースの大規模言語モデル「Kimi K2」は、OpenRouterプラットフォームでのトークン使用量(市場シェア指標)で急速に上昇し

Moonshot AI开源模型Kimi K2在OpenRouter超越Grok4等引行业关注
AI妹 4 个月前 15 0

来自中国初创公司 Moonshot AI 的开源大语言模型 Kimi K2在 OpenRouter 平台的 token 消耗量(市场份额指标)上迅速攀升,超越 xAI 的 Grok4和 OpenA

Moonshot AI开源模型Kimi K2在OpenRouter超越Grok4及GPT-4.1引关注
AI妹 4 个月前 14 0

來自中國初創公司 Moonshot AI 的開源大語言模型 Kimi K2在 OpenRouter 平臺的 token 消耗量(市場份額指標)上迅速攀升,超越 xAI 的 Grok4和 OpenA

Kimi K2编程能力登Aider前列 低成高性引开源领域热议
AI妹 4 个月前 15 0

最近、Aider Leaderboardは最新のテスト結果を発表し、Moonshot AIがリリースしたオープンソースモデルであるKimi K2がプログラミングタスクで優れたパフォーマンスを示しま

Kimi K2开源模型编程能力亮眼 低成本成终端编码Agent理想选择
AI妹 4 个月前 12 0

近日,Aider Leaderboard公佈了最新測試結果,Moonshot AI推出的開源模型Kimi K2在編程任務中表現出色,編程能力與Qwen3-235B-A22B相當,並接近o3-min