思维链 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"思维链"的内容

LLM智能体决策存知行不一等缺陷，RLFT等方法助力优化改进

LLM智能体决策存知行不一等缺陷，RLFT等方法助力优化改进

AI妹 5 个月前 17 0

现在的大模型（LLMs）已经非常智能。写文章、编代码、当医生、当老师，样样精通。于是乎，有人就想了:既然它们这么聪明，能不能让它们自己做决定，当个“智能体”呢?比如，在复杂的环境里自己探索、自己解

模仿学习上下文老虎机思维链 Token数量上限知行差距

查看详情

昆仑万维发布开源推理大模型Skywork MindLink表现优异性能卓越获多项测试冠军

昆仑万维发布开源推理大模型Skywork MindLink表现优异性能卓越获多项测试冠军

AI妹 5 个月前 16 0

昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink，同时公布了72B模型权重、技术报告及代码仓库链接，引发行业广泛关注。该模型通过创新性推理框架实现动态路径选择，可根据任

专用大模型领域 Qwen3-32B 开源计划代码仓库 Qwen2.5-72B

查看详情

谷歌DeepMind联合LIT AI实验室以RLFT技术提升AI语言模型决策执行能力

谷歌DeepMind联合LIT AI实验室以RLFT技术提升AI语言模型决策执行能力

AI妹 5 个月前 16 0

近期，谷歌 DeepMind 团队与约翰・开普勒林茨大学 LIT AI 实验室合作，开展了一项关于人工智能语言模型的新研究。他们采用了强化学习微调（RLFT）技术，旨在提升语言模型的决策能力。这项

逻辑推理推理与行动脱节蒙特卡洛基线评估思维链强化学习方法

查看详情

谷歌DeepMind新研究：RLFT技術提升AI語言模型決策力縮小推理執行差距

谷歌DeepMind新研究：RLFT技術提升AI語言模型決策力縮小推理執行差距

AI妹 5 个月前 18 0

近期，谷歌 DeepMind 團隊與約翰・開普勒林茨大學 LIT AI 實驗室合作，開展了一項關於人工智能語言模型的新研究。他們採用了強化學習微調（RLFT）技術，旨在提升語言模型的決策能力。這項

Gemini 思维链谷歌DeepMind 强化学习微调（RLFT）人工智能语言模型

查看详情

红杉中国推出xbench AI基准测试工具动态更新保障评估公正

红杉中国推出xbench AI基准测试工具动态更新保障评估公正

AI妹 5 个月前 16 0

随着人工智能技术的迅速发展，尤其是大型模型的不断进步，基准测试在评估 AI 能力时面临着前所未有的挑战。为了应对这一现状，红杉中国于5月26日宣布推出一款全新的 AI 基准测试工具 ——xbenc

垂直领域智能体人工智能技术营销领域 AGI 长青评估机制

查看详情

红杉中国推出xbench AI基准测试工具动态更新应对迭代保障评估公正全面

红杉中国推出xbench AI基准测试工具动态更新应对迭代保障评估公正全面

AI妹 5 个月前 15 0

隨着人工智能技術的迅速發展，尤其是大型模型的不斷進步，基準測試在評估 AI 能力時面臨着前所未有的挑戰。爲了應對這一現狀，紅杉中國於5月26日宣佈推出一款全新的 AI 基準測試工具 ——xbenc

思维链 GUI智能体 AI基准测试工具商用视频生成红杉中国

查看详情

西湖大学齐团队提出扩散式发散思维链革新扩散语言模型推理方式

西湖大学齐团队提出扩散式发散思维链革新扩散语言模型推理方式

AI妹 5 个月前 14 0

在近年來的人工智能研究中，思維鏈的概念越來越受到重視，尤其是在大型語言模型的訓練和推理中。最近，西湖大學 MAPLE 實驗室的齊國君教授團隊首次提出了一種新穎的 “擴散式發散思維鏈”，這是一種爲擴

Gemini Diffusion模型人工智能线性思维链代码生成西湖大学MAPLE实验室

查看详情

西湖大学团队提出扩散式发散思维链提升扩散语言模型推理能力

西湖大学团队提出扩散式发散思维链提升扩散语言模型推理能力

AI妹 5 个月前 14 0

在近年来的人工智能研究中，思维链的概念越来越受到重视，尤其是在大型语言模型的训练和推理中。最近，西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”，这是一种为扩

Gemini Diffusion模型掩码序列强化学习线性思维链推理方式

查看详情

西湖大学团队提出扩散发散思维链助力扩散语言模型提升推理能力

西湖大学团队提出扩散发散思维链助力扩散语言模型提升推理能力

AI妹 5 个月前 15 0

In recent years of artificial intelligence research, the concept of "chains of thought" has gained

西湖大学MAPLE Lab 代码生成思维链 LLaDOU 数学推理

查看详情

Grok4优先参考马斯克观点引争议，其真相承诺及应用前景受影响

Grok4优先参考马斯克观点引争议，其真相承诺及应用前景受影响

AI妹 5 个月前 14 0

xAI 的旗艦 AI 模型 Grok4近日陷入爭議，據TechCrunch 的測試結果顯示，該模型在回答爭議性問題時，似乎優先參考其創始人埃隆·馬斯克的社交媒體帖子和相關新聞報道。這一發現引發了對

敏感话题思维链社交帖子系统卡最大程度寻求真相

查看详情

2



资讯姬

文章数量13527

总阅读量230.286k

总评论量0

会员数量2

本站由emlog驱动