数学任务 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"数学任务"的内容

清华上交研究质疑RL提升大语言模型推理能力引发学界广泛讨论

清华上交研究质疑RL提升大语言模型推理能力引发学界广泛讨论

AI妹 5 个月前 19 0

【研究の転換点】清華大学と上海交通大学が共同発表した最新の論文は、業界で広く信じられている「純粋な強化学習（RL）は大規模言語モデルの推論能力を向上させる」という見解に異議を唱えています。研

大规模语言模型表现能力上海交通大学推论能力报酬构造

查看详情

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点

AI妹 5 个月前 16 0

【研究顛覆】清華大學與上海交通大學聯合發表的最新論文，對業界普遍認爲"純強化學習（RL）能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現，引入強化學習的模型在某些任務中的表現，反而遜色於

HumanEval+ 上海交通大学 Qwen-2.5-VL-7B 推理能力评估体系数学任务

查看详情

清华上交联合研究挑战传统认知：纯RL难增强大模型推理能力学界热议

清华上交联合研究挑战传统认知：纯RL难增强大模型推理能力学界热议

AI妹 5 个月前 18 0

【Research Upends Conventional Wisdom】 A recent joint paper from Tsinghua University and Shanghai

推理能力评估体系效率优化能力调节器强化学习 MATH500

查看详情

清华交大研究反驳纯RL提升大模型推理能力实验揭示关键局限

清华交大研究反驳纯RL提升大模型推理能力实验揭示关键局限

AI妹 5 个月前 16 0

【研究颠覆】清华大学与上海交通大学联合发表的最新论文，对业界普遍认为"纯强化学习（RL）能提升大模型推理能力"的观点提出了挑战性反驳。研究发现，引入强化学习的模型在某些任务中的表现，反而逊色于

基础模型学界争议数学任务知识组织大模型

查看详情

谷歌Gemini2.5 AI搜索引擎灰度测试或于I/O大会发布变革搜索体验

谷歌Gemini2.5 AI搜索引擎灰度测试或于I/O大会发布变革搜索体验

AI妹 5 个月前 18 0

随着谷歌I/O开发者大会临近（5月20日至21日），业界传出重磅消息:谷歌正计划推出基于Gemini2.5的下一代AI搜索引擎，全面替换传统的搜索框界面。这一新模式已进入灰度测试阶段，标志着谷歌将

Android16 Material3Expressive设计实时网络检索反垄断争议 Gemini2.5

查看详情

DeepSeek R1-0528发布：128K上下文+强推理编码，免费开放引行业关注

DeepSeek R1-0528发布：128K上下文+强推理编码，免费开放引行业关注

AI妹 5 个月前 16 0

As a pioneer in the AI field, DeepSeek once again sparked industry discussions with its technologi

Deepseek HuggingFace 推理能力 DeepSeek R1-0528 代码生成

查看详情

DeepSeek V3.2系列发布核心DSA升级性能对标闭源且开源可商用

DeepSeek V3.2系列发布核心DSA升级性能对标闭源且开源可商用

AI妹 6 个月前 42 0

DeepSeek 发布 V3.2（标准版）与 V3.2-Speciale(深度思考版)，官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special

MMLU 长文本DSA内核思考长度惩罚 128K上下文多数投票

查看详情



资讯姬

文章数量13535

总阅读量233.893k

总评论量0

会员数量2

本站由emlog驱动