关闭导航

包含标签"SWE-bench Verified"的内容

OpenAI推出GPT-4.1系列模型 智谱GLM同期发布 AI领域竞争加剧
AI妹 4 个月前 17 0

在人工智能領域,OpenAI 於今日正式推出其最新的 GPT-4.1模型,隨之而來還有兩個小型版本:GPT-4.1mini 和 GPT-4.1nano。這一系列新模型的性能相較於前一代 GPT-4

OpenAI o4-mini携强化微调上线 低数据降门槛加速AI专业领域转型
AI妹 4 个月前 22 0

5月8日,OpenAI o4-mini攜強化微調正式上線。這兩項技術的結合徹底改變了AI專業化的成本結構和技術門檻,讓企業能以少量訓練數據將通用AI迅速轉變爲特定領域的專家系統。 從通用智能到專

OpenAI o4-mini携强化微调上线 低数据定制专家AI降低成本门槛
AI妹 4 个月前 17 0

5月8日,OpenAI o4-mini携强化微调正式上线。这两项技术的结合彻底改变了AI专业化的成本结构和技术门槛,让企业能以少量训练数据将通用AI迅速转变为特定领域的专家系统。 从通用智能到专

Anthropic发布Claude Opus4.1 编程推理性能显著提升且安全稳健
AI妹 4 个月前 15 0

今日,人工智能公司Anthropic正式发布其旗舰模型Claude Opus4的升级版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任务、真实世界编程和推理能力,尤其是

Anthropic发布Claude Opus4.1 编码推理Agent能力升级且安全稳定
AI妹 4 个月前 12 0

Anthropic 正式發佈了其最新旗艦模型 Claude Opus4.1,在 Agent 任務、真實世界編碼和推理能力方面實現顯著提升。這一版本被定位爲 Claude Opus4的直接升級,定價

Anthropic推Claude Opus4.1 代码/推理/安全能力均获显著提升
AI妹 4 个月前 16 0

Anthropic は、最新のエクスパートモデル「Claude Opus4.1」を正式にリリースしました。エージェントタスク、現実世界のコード作成および推論能力において顕著な向上を遂げました。この

OpenAI正式発表GPT-5:全ユーザー段階公開、各分野性能躍進
AI妹 4 个月前 14 0

今朝のライブ配信イベントで、OpenAIは注目を集めるGPT-5モデルを正式に発表しました。このモデルは、同社がこれまでに開発した中でも最も優れたものであり、プログラミング、数学、ライティング、健

OpenAI发布GPT-5:技术突破多,分层开放用户,大幅降低幻觉并革新交互
AI妹 4 个月前 14 0

AIBase消息, 2025 年 8 月 8 日,OpenAI正式发布了其备受瞩目的新一代人工智能模型GPT-5。这是自GPT- 4 发布以来最重要的模型升级,标志着AI技术发展的又一重要里程碑。

GPT-5正式発表:技術突破・ユーザー階層サービス・幻覚大幅低減
AI妹 4 个月前 12 0

AIBaseメッセージ、2025年8月8日、OpenAIは待望の新世代人工知能モデルGPT-5を正式に発表しました。これはGPT-4のリリース以来最大のモデルアップグレードであり、AI技術の進化に

OpenAI发布GPT-5 开放所有用户 更像人类专家多领域能力强
AI妹 4 个月前 13 0

In the live event this early morning, OpenAI officially launched the highly anticipated GPT-5 mode