关闭导航

包含标签"强化学习优化"的内容

Grok-3重大更新推出Grok Studio一站式AI创作平台 支持代码游戏开发全用户开放
AI妹 1 个月前 8 0

人工智能技術的邊界正在不斷拓展,xAI的Grok-3再次以創新功能引領潮流。AIbase從社交媒體獲悉,Grok-3迎來重大更新,正式推出Grok Studio,一個集文檔生成、代碼編寫、報告分析

小米MiMo-7B开源大模型发布 轻量化+强化学习赋能顶级推理能力
AI妹 1 个月前 10 0

小米正式在Hugging Face平台发布其首个专为推理(Reasoning)设计的开源大模型——MiMo-7B。据AIbase了解,MiMo-7B通过从预训练到后训练的强化学习(RL)优化,展现

谷歌Gemini2.5Deep Think向AI Ultra用户开放 获IMO金牌并行思考技术领先
AI妹 1 个月前 8 0

近日,谷歌DeepMind宣布其最强大的AI模型Gemini2.5Deep Think正式向Google AI Ultra订阅用户开放。这一模型不仅在2025年国际数学奥林匹克(IMO)竞赛中摘得

阿里QwenLong-L1-32B:13万Token长上下文性能近Claude-3.7
AI妹 1 个月前 8 0

近日,阿里巴巴正式發佈全新 AI 模型 QwenLong-L1-32B,一款基於強化學習(RL)優化的長上下文推理模型,標誌着阿里巴巴在人工智能領域的又一重大突破。該模型以其超長的上下文處理能力和

阿里推出MoE架构Qwen3-Coder开源AI编程模型 性能优异免费开放给全球开发者
AI妹 1 个月前 7 0

7月23日的清晨,阿里巴巴正式推出了其全新的开源 AI 编程模型 ——Qwen3-Coder。这款模型标志着千问系列中的一次重大突破,采用了混合专家(MoE)架构,拥有高达480亿的参数量,其中可