强化学习优化 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"强化学习优化"的内容

Grok-3重大更新推出Grok Studio一站式AI创作平台支持代码游戏开发全用户开放

Grok-3重大更新推出Grok Studio一站式AI创作平台支持代码游戏开发全用户开放

AI妹 5 个月前 17 0

人工智能技術的邊界正在不斷拓展，xAI的Grok-3再次以創新功能引領潮流。AIbase從社交媒體獲悉，Grok-3迎來重大更新，正式推出Grok Studio，一個集文檔生成、代碼編寫、報告分析

免费用户 SuperGrok 协作环境代码编写文档生成

查看详情

小米MiMo-7B开源大模型发布轻量化+强化学习赋能顶级推理能力

小米MiMo-7B开源大模型发布轻量化+强化学习赋能顶级推理能力

AI妹 5 个月前 31 0

小米正式在Hugging Face平台发布其首个专为推理（Reasoning）设计的开源大模型——MiMo-7B。据AIbase了解，MiMo-7B通过从预训练到后训练的强化学习(RL)优化，展现

Llama3.18B DeepSeekMath 小米AI实验室通用推理任务智能辅导系统

查看详情

谷歌Gemini2.5Deep Think向AI Ultra用户开放获IMO金牌并行思考技术领先

谷歌Gemini2.5Deep Think向AI Ultra用户开放获IMO金牌并行思考技术领先

AI妹 5 个月前 17 0

近日，谷歌DeepMind宣布其最强大的AI模型Gemini2.5Deep Think正式向Google AI Ultra订阅用户开放。这一模型不仅在2025年国际数学奥林匹克（IMO）竞赛中摘得

Humanity’s Last Exam 编码基准测试谷歌搜索工具 Google AI Ultra AlphaGeometry2

查看详情

阿里QwenLong-L1-32B：13万Token长上下文性能近Claude-3.7

阿里QwenLong-L1-32B：13万Token长上下文性能近Claude-3.7

AI妹 5 个月前 15 0

近日，阿里巴巴正式發佈全新 AI 模型 QwenLong-L1-32B，一款基於強化學習（RL）優化的長上下文推理模型，標誌着阿里巴巴在人工智能領域的又一重大突破。該模型以其超長的上下文處理能力和

长上下文推理模型多段文档综合分析 QwenLong-L1-32B 阿里巴巴AI模型跨文档跳跃推理

查看详情

阿里推出MoE架构Qwen3-Coder开源AI编程模型性能优异免费开放给全球开发者

阿里推出MoE架构Qwen3-Coder开源AI编程模型性能优异免费开放给全球开发者

AI妹 5 个月前 31 0

7月23日的清晨，阿里巴巴正式推出了其全新的开源 AI 编程模型 ——Qwen3-Coder。这款模型标志着千问系列中的一次重大突破，采用了混合专家（MoE）架构，拥有高达480亿的参数量，其中可

开源AI编程模型 7.5TB数据集 1M token扩展 35亿可激活参数通义灵码

查看详情



资讯姬

文章数量13527

总阅读量227.547k

总评论量0

会员数量2

本站由emlog驱动