研究机构 METR 最新发布的一项研究显示,被广泛用于评估 AI 编程能力的基准测试 SWE-bench Verified 可能显著高估了 AI 代理在真实软件开发环境中的表现。研究发现,在基准测
国产大模型领军企业MiniMax正式开启资本市场征程。公司于12月30日向港交所提交全球发售公告,宣布拟全球发行25,389,220股H股,其中香港公开发售1,269,480股,国际配售24,11
MiniMax M2.1正式上线。这款模型专为真实编码和原生 AI 组织设计,能够轻松应对从氛围构建到严肃工作流程的各种需求。MiniMax M2.1是一款拥有100亿激活量的 SOTA(最先进技
快手研发的 Agentic Coding 模型 KAT-Coder-Pro V1 近日宣布重磅升级,在知名大模型竞技场 Artificial Analysis Intelligence Index