关闭导航

包含标签"强化学习"的内容

阿里巴巴发布QwenLong-L1-32B 长上下文推理模型实现重大技术突破
AI妹 4 个月前 14 0

阿里巴巴今日正式發佈QwenLong-L1-32B,這是一款專爲長上下文推理設計的大型語言模型,標誌着AI長文本處理能力的重大突破。該模型在性能表現上超越了o3-mini和Qwen3-235B-A

西湖大学齐团队提出扩散式发散思维链 革新扩散语言模型推理方式
AI妹 4 个月前 13 0

在近年來的人工智能研究中,思維鏈的概念越來越受到重視,尤其是在大型語言模型的訓練和推理中。最近,西湖大學 MAPLE 實驗室的齊國君教授團隊首次提出了一種新穎的 “擴散式發散思維鏈”,這是一種爲擴

西湖大学团队提出扩散式发散思维链 提升扩散语言模型推理能力
AI妹 4 个月前 13 0

在近年来的人工智能研究中,思维链的概念越来越受到重视,尤其是在大型语言模型的训练和推理中。最近,西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”,这是一种为扩

西湖大学团队提出扩散发散思维链 助力扩散语言模型提升推理能力
AI妹 4 个月前 14 0

In recent years of artificial intelligence research, the concept of "chains of thought" has gained

阿里巴巴发布QwenLong-L1-32B 13万Token长上下文模型性能逼近Claude-3.7
AI妹 4 个月前 11 0

近日,阿里巴巴正式发布全新 AI 模型 QwenLong-L1-32B,一款基于强化学习(RL)优化的长上下文推理模型,标志着阿里巴巴在人工智能领域的又一重大突破。该模型以其超长的上下文处理能力和

夸克上线行业首个高考志愿深度搜索 助力考生破解填报信息迷局
AI妹 4 个月前 16 0

“河南鄭州二模549分,歷史類,一本線517分,推薦一下應該怎麼報考”。高考臨近,這類問題成爲考生和家長搜索查詢的典型方式。 試着把這個問題丟給傳統搜索引擎,結果前排是廣告,後面是匹配不準確的網

夸克上线高考志愿填报深度搜索能力 助力考生破解信息迷雾
AI妹 4 个月前 19 0

“河南郑州二模549分,历史类,一本线517分,推荐一下应该怎么报考”。高考临近,这类问题成为考生和家长搜索查询的典型方式。 试着把这个问题丢给传统搜索引擎,结果前排是广告,后面是匹配不准确的网

Oracle斥400亿美元购Nvidia芯片助力OpenAI,星门数据中心电力存挑战
AI妹 4 个月前 18 0

根据《金融时报》的报道,Oracle 公司将花费约400亿美元购买 Nvidia 最新的超级芯片,计划为 OpenAI 提供计算能力。这些超级芯片将部署在位于德克萨斯州阿比林的首个美国 “星门”

DeepSeek-R1重大更新:代码推理能力提升 开源对标o1成本优势显著
AI妹 4 个月前 15 0

 DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。以下基于公开信息

阿里开源WebAgent:自主搜索AI智能体赋能高效信息检索
AI妹 4 个月前 14 0

阿里巴巴在 GitHub 上發佈了其創新的自主搜索 AI 智能體 ——WebAgent。這款 AI 智能體具備端到端的信息檢索和多步推理能力,能夠像人類一樣在網絡環境中主動搜索、分析和決策。它的推