关闭导航

包含标签"SWE-bench"的内容

LongCat-Next原生多模态大模型发布开源 打破模态阻隔推动产业落地
AI妹 5 天前 1 0

全球人工智能界正迎来一场关于“AI母语”的技术革新。针对当前大模型普遍存在的“以语言为中心、外挂视觉或语音模块”的拼凑式异构架构,大模型研发团队于近日正式发布并开源了全新原生多模态大模型 Long

Cursor发布自研Composer2.5编程模型 性能顶尖性价比优势显著挑战行业巨头
AI妹 22 天前 2 0

人工智能编程领域迎来重磅搅局者。AI代码编辑器开发商Cursor近日正式发布了其自研编程大模型的重大升级版本——Composer 2.5。该模型基于月之暗面开源的Kimi K2. 5 模型基座微调

蚂蚁集团Ling-2.6-flash大模型全球开放 混合架构提效强化智能体能力
AI妹 1 个月前 3 0

蚂蚁集团旗下的百灵大模型系列于今日迎来重要更新, Ling-2.6-flash 正式向全球开发者开放。为了适配差异化的硬件环境并降低部署门槛,该模型同步推出了 B

Notion引入MiniMax M2.5 国产开源大模型跻身全球主流生产力工具
AI妹 3 个月前 5 0

全球顶级协同办公平台 Notion 正在加速拥抱混合模型生态。2026 年 3 月 2 日,Notion 联合创始人 Akshay Kothari 宣布,

美团LongCat-Flash-Lite总685亿参凭嵌入扩展破瓶颈性能优异智能体代码领跑开源
AI妹 4 个月前 1070 0

 传统 MoE(混合专家)架构通过增加专家数量提升模型能力,却常受困于边际收益递减与高昂的通信开销。今日,美团 LongCat 团队发布了全新模型 LongCat-Flash-Lite,

重磅Claude Sonnet5:蜂群模式编程模型性能强价格低颠覆行业
AI妹 4 个月前 112 0

根据近期泄露的行业情报,Anthropic 的下一代大模型 Claude Sonnet5(内部代号 Fennec)已部署于谷歌基础设施中,发布在即。这款被视为“史上最强编程模型”的新品,不仅在性能

Claude Sonnet5泄露:性能超旗舰 蜂群模式+高性价比重构开发生产力范式
AI妹 4 个月前 145 0

全球开发者社区正因一场“史诗级”的泄露而沸腾。多方证据显示,Anthropic 的新一代编程大模型 Claude Sonnet5(代号 Fennec)已现身谷歌云基础设施,并有望于2026年2月初

2025 AI编程爆发:技术提升融资火热 国内蓬勃成转型关键年
AI妹 5 个月前 32 0

2025 年,AI编程领域迎来爆发式增长。从简单的代码补全进化到多代理协作系统,AI已不再是辅助工具,而是能够独立处理复杂软件工程任务的“智能伙伴”。斯坦福大学人类中心人工智能研究所(HAI)发布

智谱华章正式发布开源GLM-4.7大模型 编码性能卓越居开源国产双榜首
AI妹 5 个月前 38 0

12月22日,北京智谱华章科技股份有限公司正式发布并开源其新一代旗舰大语言模型 GLM-4.7,在全球大模型竞争中再掀波澜,为开发者与研究人员带来全新选择。该模型在多项国际主流公开基准测试中表现卓

MiniMax开源M2.1编码模型 性能超越闭源旗舰 稀疏架构高效低耗
AI妹 5 个月前 35 0

国产大模型再攀高峰。MiniMax今日正式开源其最新编码与智能体专用大模型——M2.1,以100亿激活参数的稀疏架构,在多语言编程、真实代码生成与工具调用等核心场景实现全面突破。在权威基准SWE-