关闭导航

包含标签"SWE-bench Verified"的内容

OpenAI发布GPT-4.1系列模型 全面超越GPT-4o 高效低成本
AI妹 5 个月前 33 0

4月15日,OpenAI 在其官方博客宣佈正式發佈 GPT-4.1系列模型,涵蓋 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。該系列在編程能力、指令理解及長文本

OpenAI推出GPT-4.1系列新模型 性能提升成本优化且API专用
AI妹 5 个月前 19 0

人工知能分野の競争が激化する中、OpenAIが技術革新で再び業界をリードしています。AIbaseがソーシャルメディアから得た情報によると、OpenAIは最近、APIを通じてGPT-4.1、GPT-

OpenAI发布GPT-4.1系列模型 性能跃升成本降低成行业新焦点
AI妹 5 个月前 24 0

人工智能領域的競爭日趨白熱化,OpenAI再次以技術突破引領潮流。AIbase從社交媒體獲悉,OpenAI於近日通過API形式發佈了三款全新模型:GPT-4.1、GPT-4.1mini和GPT-4

OpenAI GPT-4.1提示工程指南解析:核心要点与行业影响
AI妹 5 个月前 22 0

人工智能技术的快速发展对提示工程(Prompt Engineering)提出了更高要求。AIbase从社交媒体获悉,OpenAI于近日发布了针对GPT-4.1的提示工程指南,详细阐述了如何通过清晰

OpenAI推出GPT-4.1系列模型 智谱GLM同期发布 AI领域竞争加剧
AI妹 5 个月前 21 0

在人工智能領域,OpenAI 於今日正式推出其最新的 GPT-4.1模型,隨之而來還有兩個小型版本:GPT-4.1mini 和 GPT-4.1nano。這一系列新模型的性能相較於前一代 GPT-4

OpenAI o4-mini携强化微调上线 低数据降门槛加速AI专业领域转型
AI妹 5 个月前 25 0

5月8日,OpenAI o4-mini攜強化微調正式上線。這兩項技術的結合徹底改變了AI專業化的成本結構和技術門檻,讓企業能以少量訓練數據將通用AI迅速轉變爲特定領域的專家系統。 從通用智能到專

OpenAI o4-mini携强化微调上线 低数据定制专家AI降低成本门槛
AI妹 5 个月前 21 0

5月8日,OpenAI o4-mini携强化微调正式上线。这两项技术的结合彻底改变了AI专业化的成本结构和技术门槛,让企业能以少量训练数据将通用AI迅速转变为特定领域的专家系统。 从通用智能到专

Anthropic发布Claude Opus4.1 编程推理性能显著提升且安全稳健
AI妹 5 个月前 18 0

今日,人工智能公司Anthropic正式发布其旗舰模型Claude Opus4的升级版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任务、真实世界编程和推理能力,尤其是

Anthropic发布Claude Opus4.1 编码推理Agent能力升级且安全稳定
AI妹 5 个月前 15 0

Anthropic 正式發佈了其最新旗艦模型 Claude Opus4.1,在 Agent 任務、真實世界編碼和推理能力方面實現顯著提升。這一版本被定位爲 Claude Opus4的直接升級,定價

Anthropic推Claude Opus4.1 代码/推理/安全能力均获显著提升
AI妹 5 个月前 19 0

Anthropic は、最新のエクスパートモデル「Claude Opus4.1」を正式にリリースしました。エージェントタスク、現実世界のコード作成および推論能力において顕著な向上を遂げました。この