关闭导航

包含标签"SWE-bench"的内容

谷歌Gemini3Flash发布:速度快3倍成本大幅降 编程反超旗舰成新搜索默认引擎
AI妹 1 个月前 15 0

大模型领域的“性价比之战”再次升级!近日,谷歌宣布正式发布其最新一代轻量化旗舰模型 Gemini3Flash 。令人惊喜的是,这款主打“极速与

谷歌Gemini3Flash发布:首个反超Pro的Flash 性能顶尖响应快三倍全球免费开放
AI妹 1 个月前 12 0

谷歌再次改写大模型性能与成本的边界。今日,公司正式发布新一代轻量级模型 Gemini3Flash——不仅响应速度达到前代三倍、近乎“零延迟”,更在多项高难度基准测试中反超同代旗舰Gemini3Pr

Anthropic发布Claude Opus4.5:推理对话升级 软件工程能力领跑
AI妹 1 个月前 16 0

Anthropic近日正式发布其迄今为止最强大的AI模型Claude Opus4.5。这一突破性升级标志着AI在推理、对话和软件工程领域的全新巅峰,预计将深刻影响开发者社区和企业级应用。Claud