关闭导航

包含标签"SWE-bench"的内容

Notion引入MiniMax M2.5 国产开源大模型跻身全球主流生产力工具
AI妹 1 个月前 2 0

全球顶级协同办公平台 Notion 正在加速拥抱混合模型生态。2026 年 3 月 2 日,Notion 联合创始人 Akshay Kothari 宣布,

美团LongCat-Flash-Lite总685亿参凭嵌入扩展破瓶颈性能优异智能体代码领跑开源
AI妹 2 个月前 1067 0

 传统 MoE(混合专家)架构通过增加专家数量提升模型能力,却常受困于边际收益递减与高昂的通信开销。今日,美团 LongCat 团队发布了全新模型 LongCat-Flash-Lite,

重磅Claude Sonnet5:蜂群模式编程模型性能强价格低颠覆行业
AI妹 2 个月前 109 0

根据近期泄露的行业情报,Anthropic 的下一代大模型 Claude Sonnet5(内部代号 Fennec)已部署于谷歌基础设施中,发布在即。这款被视为“史上最强编程模型”的新品,不仅在性能

Claude Sonnet5泄露:性能超旗舰 蜂群模式+高性价比重构开发生产力范式
AI妹 2 个月前 142 0

全球开发者社区正因一场“史诗级”的泄露而沸腾。多方证据显示,Anthropic 的新一代编程大模型 Claude Sonnet5(代号 Fennec)已现身谷歌云基础设施,并有望于2026年2月初

2025 AI编程爆发:技术提升融资火热 国内蓬勃成转型关键年
AI妹 3 个月前 31 0

2025 年,AI编程领域迎来爆发式增长。从简单的代码补全进化到多代理协作系统,AI已不再是辅助工具,而是能够独立处理复杂软件工程任务的“智能伙伴”。斯坦福大学人类中心人工智能研究所(HAI)发布

智谱华章正式发布开源GLM-4.7大模型 编码性能卓越居开源国产双榜首
AI妹 3 个月前 35 0

12月22日,北京智谱华章科技股份有限公司正式发布并开源其新一代旗舰大语言模型 GLM-4.7,在全球大模型竞争中再掀波澜,为开发者与研究人员带来全新选择。该模型在多项国际主流公开基准测试中表现卓

MiniMax开源M2.1编码模型 性能超越闭源旗舰 稀疏架构高效低耗
AI妹 3 个月前 32 0

国产大模型再攀高峰。MiniMax今日正式开源其最新编码与智能体专用大模型——M2.1,以100亿激活参数的稀疏架构,在多语言编程、真实代码生成与工具调用等核心场景实现全面突破。在权威基准SWE-

OpenAI拟30亿收购Windsurf 最大规模收购剑指开发者生态扩展
AI妹 4 个月前 28 0

ブルームバーグが最初に報道したところによると、OpenAIはAI支援プログラミングツールWindsurf(旧Codeium)の買収交渉を進めており、取引額は約30億ドルにのぼるとのことです。この潜

OpenAI拟30亿美元收购Windsurf 强化AI编程工具与开发者生态布局
AI妹 4 个月前 35 0

彭博社率先报道,OpenAI 正与人工智能辅助编程工具 Windsurf(前身为 Codeium)展开收购谈判,交易金额约为30亿美元。这一潜在收购将成为 OpenAI 迄今为止最大规模的并购交易