强化学习训练 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"强化学习训练"的内容

阿里发布Qwen3-Max-Thinking推理模型千问接入提升智能推理与知识能力

阿里发布Qwen3-Max-Thinking推理模型千问接入提升智能推理与知识能力

AI妹 4 个月前 18 0

1月26日，阿里正式发布旗舰推理模型Qwen3-Max-Thinking，AI助手千问同步在PC端和网页端（qianwen.com）接入这一国内最强“AI大脑”，千问App也即将接入。用户只需在模

网页端qianwen.com 千问万亿参数量 GPT-5.2-Thinking-xhigh 千问月活超1亿

查看详情

阿里发布Qwen3-Max-Thinking 万亿参数推理智能体对标国际顶流模型

阿里发布Qwen3-Max-Thinking 万亿参数推理智能体对标国际顶流模型

AI妹 4 个月前 11 0

阿里巴巴正式发布千问系列旗舰推理模型——Qwen3-Max-Thinking。该模型在复杂推理、事实知识及智能体能力等核心维度实现跨越式升级，号称总参数量已突破万亿大关。在多项权威基准测试中，其综

强化学习训练开发者开放阿里巴巴万亿级参数推理 qwen3-max-2026-01-23

查看详情

智谱华章开源GLM系列模型 MIT协议多规格支持商业应用及新平台体验

智谱华章开源GLM系列模型 MIT协议多规格支持商业应用及新平台体验

AI妹 5 个月前 18 0

備受矚目的國內人工智能企業智譜華章（以下簡稱“智譜”）近日正式宣佈，開源其新一代 GLM 系列大語言模型。此次開源力度空前，不僅包含 32B 和9B 兩種參數規模的模型，更涵蓋了基座模型、推

GLM-4-Flash-250414 推理模型指令遵循 GPT-4o 创新加速

查看详情

微软通过Windows AI Foundry向Win11用户提供OpenAI开源模型gpt-oss-20b

微软通过Windows AI Foundry向Win11用户提供OpenAI开源模型gpt-oss-20b

AI妹 5 个月前 15 0

微软近日宣布，通过其 Windows AI Foundry 平台，正式向 Windows11用户提供 OpenAI 最新发布的免费开源大模型 gpt-oss-20b。这意味着用户无需依

GPT-OSS-20B 代码执行 OpenAI Windows AI Foundry 本地运行AI

查看详情

阿里通义ZeroSearch框架：强化学习模拟搜索无需真实引擎提升大模型推理

阿里通义ZeroSearch框架：强化学习模拟搜索无需真实引擎提升大模型推理

AI妹 5 个月前 16 0

在人工智能的迅速發展中，如何提升大語言模型（LLM）的檢索和推理能力成爲研究的熱門話題。近日，阿里通義實驗室提出了一個名爲 “ZeroSearch” 的新框架，它能夠使大型語言模型自己模擬搜索引擎

多跳问答阿里通义实验室强化学习训练问答任务大语言模型(LLM)

查看详情

阿里发布QwenLong-L1-32B 长文本推理模型实现重大突破

阿里发布QwenLong-L1-32B 长文本推理模型实现重大突破

AI妹 5 个月前 16 0

阿里巴巴今日正式发布QwenLong-L1-32B，这是一款专为长上下文推理设计的大型语言模型，标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A

完整解决方案体系大型语言模型 Tongyi-Zhiwen Claude-3.7-Sonnet-Thinking 七个长文本情境文档问答基准测试

查看详情



资讯姬

文章数量13527

总阅读量227.547k

总评论量0

会员数量2

本站由emlog驱动