关闭导航

包含标签"数学推理"的内容

DeepSeek-Prover-V2:创新训练方法,提升数学推理,迈向AGI关键一步
AI妹 4 个月前 17 0

在人工智能領域,最近一項重磅技術發佈引發廣泛關注 ——DeepSeek-Prover-V2。這一模型不僅在推理性能上取得了顯著提升,還被譽爲通向人工通用智能(AGI)的關鍵一步。DeepSeek-

阿里通义千问Qwen3新模型开源 性能媲美GPT-4o等闭源且长文本处理提升
AI妹 4 个月前 13 0

7月30日,阿里巴巴的通義千問團隊正式推出了 Qwen3系列模型的最新成員 ——Qwen3-30B-A3B-Instruct-2507。這一全新的開源模型採用非思考模式(non-thinking

通义千问Qwen3-30B新模型开源 性能比肩GPT-4o等知名闭源模型
AI妹 4 个月前 14 0

7月30日,阿里巴巴的通义千问团队正式推出了 Qwen3系列模型的最新成员 ——Qwen3-30B-A3B-Instruct-2507。这一全新的开源模型采用非思考模式(non-thinking

谷歌Gemini2.5Deep Think开放订阅 获IMO金牌展跨领域强推理能力
AI妹 4 个月前 16 0

近日,谷歌DeepMind宣佈其最強大的AI模型Gemini2.5Deep Think正式向Google AI Ultra訂閱用戶開放。這一模型不僅在2025年國際數學奧林匹克(IMO)競賽中摘得

Self-Refine方法:驱动大语言模型自我优化 多任务输出质量平均提升20%
AI妹 4 个月前 14 0

Self-Refine方法因其通過自我批評與反思顯著提升大語言模型(LLM)輸出質量,再度成爲AI研究熱點(https://arxiv.org/abs/2303.17651)。這一創新框架讓單一L

MiniCPM-V4.0开源:轻量高性能多模态模型 开启手机AI应用新篇章
AI妹 4 个月前 15 0

 The OpenBMB team recently announced the official open-source release of the new multimodal l

GPT-5登顶LMArena六大核心领域居首 重塑AI行业竞争格局
AI妹 4 个月前 13 0

AIBase消息,OpenAI的GPT-5在权威AI模型评测平台LMArena中创造历史,以最高Arena得分登顶排行榜首位,超越Google Gemini2.5Pro和Anthropic Cla

GPT-5获LMArena历史最高得分登顶 六大核心领域领先竞品重塑AI格局
AI妹 4 个月前 12 0

AIBaseメッセージ、OpenAIのGPT-5が権威あるAIモデル評価プラットフォームLMArenaで歴史的な記録を樹立し、最高のArenaスコアを獲得してランキング首位に登場しました。Goog

OpenAI发布GPT-5系列模型 四版本覆盖全场景+核心突破+开放定价革新AI体验

(注:经调整,该标题准确涵盖核心事件、产品特点及关键策略,符合30字左右要求)
AI妹 4 个月前 13 0

AIBase消息,2025年8月7日,OpenAI正式发布GPT-5系列模型,这是该公司历史上最重要的产品升级。此次发布包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四个

OpenAI发布GPT-5系列四版本 技术突破覆盖多场景并推免费开放策略
AI妹 4 个月前 18 0

AIBase消息,2025年8月7日,OpenAI正式發佈GPT-5系列模型,這是該公司歷史上最重要的產品升級。此次發佈包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四個