关闭导航

包含标签"强化学习训练"的内容

阿里发布Qwen3-Max-Thinking推理模型 千问接入提升智能推理与知识能力
AI妹 2 个月前 14 0

1月26日,阿里正式发布旗舰推理模型Qwen3-Max-Thinking,AI助手千问同步在PC端和网页端(qianwen.com)接入这一国内最强“AI大脑”,千问App也即将接入。用户只需在模

阿里发布Qwen3-Max-Thinking 万亿参数推理智能体对标国际顶流模型
AI妹 2 个月前 8 0

阿里巴巴正式发布千问系列旗舰推理模型——Qwen3-Max-Thinking。该模型在复杂推理、事实知识及智能体能力等核心维度实现跨越式升级,号称总参数量已突破万亿大关。在多项权威基准测试中,其综

智谱华章开源GLM系列模型 MIT协议多规格支持商业应用及新平台体验
AI妹 3 个月前 15 0

備受矚目的國內人工智能企業智譜華章(以下簡稱“智譜”)近日正式宣佈,開源其新一代 GLM 系列大語言模型。 此次開源力度空前,不僅包含 32B 和9B 兩種參數規模的模型,更涵蓋了 基座模型、推

微软通过Windows AI Foundry向Win11用户提供OpenAI开源模型gpt-oss-20b
AI妹 3 个月前 12 0

 微软近日宣布,通过其 Windows AI Foundry 平台,正式向 Windows11用户提供 OpenAI 最新发布的免费开源大模型 gpt-oss-20b。这意味着用户无需依

阿里通义ZeroSearch框架:强化学习模拟搜索无需真实引擎提升大模型推理
AI妹 3 个月前 13 0

在人工智能的迅速發展中,如何提升大語言模型(LLM)的檢索和推理能力成爲研究的熱門話題。近日,阿里通義實驗室提出了一個名爲 “ZeroSearch” 的新框架,它能夠使大型語言模型自己模擬搜索引擎

阿里发布QwenLong-L1-32B 长文本推理模型实现重大突破
AI妹 3 个月前 12 0

阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A