SWE-bench Verified - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"SWE-bench Verified"的内容

Moonshot AI开源模型Kimi K2在OpenRouter超越Grok4等引行业关注

Moonshot AI开源模型Kimi K2在OpenRouter超越Grok4等引行业关注

AI妹 5 个月前 18 0

来自中国初创公司 Moonshot AI 的开源大语言模型 Kimi K2在 OpenRouter 平台的 token 消耗量（市场份额指标）上迅速攀升，超越 xAI 的 Grok4和 OpenA

DeepSeek时刻推理能力开源模型崛起工具使用 LiveCodeBench

查看详情

Moonshot AI开源模型Kimi K2在OpenRouter超越Grok4及GPT-4.1引关注

Moonshot AI开源模型Kimi K2在OpenRouter超越Grok4及GPT-4.1引关注

AI妹 5 个月前 17 0

來自中國初創公司 Moonshot AI 的開源大語言模型 Kimi K2在 OpenRouter 平臺的 token 消耗量（市場份額指標）上迅速攀升，超越 xAI 的 Grok4和 OpenA

开源大语言模型推理 OJBench 工具使用 Gpt-4.1

查看详情

Kimi K2编程能力登Aider前列低成高性引开源领域热议

Kimi K2编程能力登Aider前列低成高性引开源领域热议

AI妹 5 个月前 17 0

最近、Aider Leaderboardは最新のテスト結果を発表し、Moonshot AIがリリースしたオープンソースモデルであるKimi K2がプログラミングタスクで優れたパフォーマンスを示しま

Moonshot AI LiveCodeBench EvalPlus 大規模言語モデルプログラミング能力

查看详情

Kimi K2开源模型编程能力亮眼低成本成终端编码Agent理想选择

Kimi K2开源模型编程能力亮眼低成本成终端编码Agent理想选择

AI妹 5 个月前 14 0

近日，Aider Leaderboard公佈了最新測試結果，Moonshot AI推出的開源模型Kimi K2在編程任務中表現出色，編程能力與Qwen3-235B-A22B相當，並接近o3-min

开源模型 Hugging Face MIT协议 API 编程能力

查看详情

阿里云Qwen3-Coder AI编程大模型开源能力达开源顶尖水平

阿里云Qwen3-Coder AI编程大模型开源能力达开源顶尖水平

AI妹 5 个月前 45 0

7月23日，阿里雲正式宣佈其最新的AI編程大模型Qwen3-Coder全面開源，這一舉措迅速在智能編程領域掀起熱潮。Qwen3-Coder憑藉其卓越的代碼生成和Agent能力，在Agentic C

通义团队 Agentic Coding 阿里云 Qwen3-Coder 魔搭社区

查看详情

Mistral AI发布Devstral2系列开源编码模型性能刷新纪录工具同步开源

Mistral AI发布Devstral2系列开源编码模型性能刷新纪录工具同步开源

AI妹 6 个月前 23 0

Mistral AI 正式推出第二代开源编码模型家族:Devstral2（1230亿参数旗舰版）与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verif

轻量免费旗舰API 大厂白嫖防范 GitHub Copilot 开源编码模型 INT4量化版

查看详情

Mistral AI发布新一代Devstral2系列编码模型及Mistral Vibe开源工具

Mistral AI发布新一代Devstral2系列编码模型及Mistral Vibe开源工具

AI妹 6 个月前 21 0

近日，Mistral AI 正式发布了其第二代开源编码模型家族，分别命名为 Devstral2和 Devstral Small2。这两款新模型不仅在性能上取得了显著进展，而且在许可策略上也进行了差

Mistral Vibe Mistral AI Devstral2 修改后的MIT许可 Apache2.0许可

查看详情

Mistral AI推出Devstral2及Small2编码模型，含差异化许可与Vibe工具

Mistral AI推出Devstral2及Small2编码模型，含差异化许可与Vibe工具

AI妹 6 个月前 21 0

Mistral AI 正式推出其第二代开源编码模型家族:Devstral2 和 Devstral Small2。此次发布的核心亮点是旗舰模型在性能上实现突破，同时该公司采用了针对不同规

开源编码模型 API访问 Claude Sonnet SWE-bench Verified Mistral Vibe

查看详情

腾讯混元2.0发布：混合专家架构长上下文推理效率业界领先接入生态

腾讯混元2.0发布：混合专家架构长上下文推理效率业界领先接入生态

AI妹 6 个月前 32 0

腾讯自研大模型混元2.0（Tencent HY2.0）正式发布，与此同时，DeepSeek V3.2也逐步接入腾讯生态。目前，这两大模型已在元宝、ima等腾讯AI原生应用中率先上线，腾讯云也同步开

重要性采样修正智能体能力 HLE 元宝腾讯AI原生应用

查看详情

OpenAI推GPT-5.1-Codex-Max 性能提升价格不变适配Win

OpenAI推GPT-5.1-Codex-Max 性能提升价格不变适配Win

AI妹 6 个月前 28 0

近日，OpenAI 正式向开发者推出其最新的编程模型 ——GPT-5.1-Codex-Max。这一新模型不仅在性能上有了显著提升，而且在价格上却与其前身 GPT-5保持一致，成为开发者们热议的焦点

代理式编码能力 API价格压缩技术 SWE-bench Verified GPT-5

查看详情

6



资讯姬

文章数量13533

总阅读量233.892k

总评论量0

会员数量2

本站由emlog驱动