阿里巴巴今日正式發佈QwenLong-L1-32B,這是一款專爲長上下文推理設計的大型語言模型,標誌着AI長文本處理能力的重大突破。該模型在性能表現上超越了o3-mini和Qwen3-235B-A
在近年來的人工智能研究中,思維鏈的概念越來越受到重視,尤其是在大型語言模型的訓練和推理中。最近,西湖大學 MAPLE 實驗室的齊國君教授團隊首次提出了一種新穎的 “擴散式發散思維鏈”,這是一種爲擴
在近年来的人工智能研究中,思维链的概念越来越受到重视,尤其是在大型语言模型的训练和推理中。最近,西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”,这是一种为扩
In recent years of artificial intelligence research, the concept of "chains of thought" has gained
近日,阿里巴巴正式发布全新 AI 模型 QwenLong-L1-32B,一款基于强化学习(RL)优化的长上下文推理模型,标志着阿里巴巴在人工智能领域的又一重大突破。该模型以其超长的上下文处理能力和
“河南鄭州二模549分,歷史類,一本線517分,推薦一下應該怎麼報考”。高考臨近,這類問題成爲考生和家長搜索查詢的典型方式。 試着把這個問題丟給傳統搜索引擎,結果前排是廣告,後面是匹配不準確的網
“河南郑州二模549分,历史类,一本线517分,推荐一下应该怎么报考”。高考临近,这类问题成为考生和家长搜索查询的典型方式。 试着把这个问题丢给传统搜索引擎,结果前排是广告,后面是匹配不准确的网
根据《金融时报》的报道,Oracle 公司将花费约400亿美元购买 Nvidia 最新的超级芯片,计划为 OpenAI 提供计算能力。这些超级芯片将部署在位于德克萨斯州阿比林的首个美国 “星门”
DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。以下基于公开信息
阿里巴巴在 GitHub 上發佈了其創新的自主搜索 AI 智能體 ——WebAgent。這款 AI 智能體具備端到端的信息檢索和多步推理能力,能夠像人類一樣在網絡環境中主動搜索、分析和決策。它的推