关闭导航

包含标签"强化学习训练"的内容

智谱华章开源GLM系列模型 MIT协议多规格支持商业应用及新平台体验
AI妹 1 个月前 10 0

備受矚目的國內人工智能企業智譜華章(以下簡稱“智譜”)近日正式宣佈,開源其新一代 GLM 系列大語言模型。 此次開源力度空前,不僅包含 32B 和9B 兩種參數規模的模型,更涵蓋了 基座模型、推

微软通过Windows AI Foundry向Win11用户提供OpenAI开源模型gpt-oss-20b
AI妹 1 个月前 9 0

 微软近日宣布,通过其 Windows AI Foundry 平台,正式向 Windows11用户提供 OpenAI 最新发布的免费开源大模型 gpt-oss-20b。这意味着用户无需依

阿里通义ZeroSearch框架:强化学习模拟搜索无需真实引擎提升大模型推理
AI妹 1 个月前 9 0

在人工智能的迅速發展中,如何提升大語言模型(LLM)的檢索和推理能力成爲研究的熱門話題。近日,阿里通義實驗室提出了一個名爲 “ZeroSearch” 的新框架,它能夠使大型語言模型自己模擬搜索引擎

阿里发布QwenLong-L1-32B 长文本推理模型实现重大突破
AI妹 1 个月前 9 0

阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A