关闭导航

包含标签"大型语言模型"的内容

阿里发布QwenLong-L1-32B 长文本推理模型实现重大突破
AI妹 5 个月前 17 0

阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A

阿里巴巴发布QwenLong-L1-32B 长上下文推理模型实现重大技术突破
AI妹 5 个月前 15 0

阿里巴巴今日正式發佈QwenLong-L1-32B,這是一款專爲長上下文推理設計的大型語言模型,標誌着AI長文本處理能力的重大突破。該模型在性能表現上超越了o3-mini和Qwen3-235B-A

西湖大学团队提出扩散式发散思维链 提升扩散语言模型推理能力
AI妹 5 个月前 14 0

在近年来的人工智能研究中,思维链的概念越来越受到重视,尤其是在大型语言模型的训练和推理中。最近,西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”,这是一种为扩

OpenAI发布HealthBench医疗评估数据集 首次独立探索医疗领域
AI妹 5 个月前 18 0

OpenAI 正式发布了一个大型数据集,旨在评估大型语言模型在医疗健康领域回答问题的能力。这一项目被命名为 HealthBench,专家们对这一开源数据和详细的评估标准给予了高度赞誉,称其在规模和

OpenAI发布HealthBench医疗数据集 首次独立探索医疗AI评估领域
AI妹 5 个月前 15 0

OpenAI 正式發佈了一個大型數據集,旨在評估大型語言模型在醫療健康領域回答問題的能力。這一項目被命名爲 HealthBench,專家們對這一開源數據和詳細的評估標準給予了高度讚譽,稱其在規模和

Meta研究:缩短推理链使AI准确率升34.5%,新方法降计算成本40%
AI妹 5 个月前 16 0

近期,Meta 的 FAIR 團隊與耶路撒冷希伯來大學的研究人員聯合發佈了一項新研究,表明減少大型語言模型的推理時間可以顯著提高其在複雜推理任務中的表現。研究結果顯示,使用較短推理鏈的 AI 模型

Meta联合研究:短推理链提升AI准确率34.5%并降低计算成本
AI妹 5 个月前 17 0

近期,Meta 的 FAIR 团队与耶路撒冷希伯来大学的研究人员联合发布了一项新研究,表明减少大型语言模型的推理时间可以显著提高其在复杂推理任务中的表现。研究结果显示,使用较短推理链的 AI 模型

Ollama v0.8发布:流式传输、工具调用与性能优化赋能本地AI
AI妹 5 个月前 18 0

Ollama官方宣佈推出其最新版本Ollama v0.8,爲本地運行大型語言模型(LLM)帶來了突破性升級。新版本引入了流式傳輸響應和工具調用功能,支持實時網絡搜索等交互場景,顯著提升了本地AI的

亚利桑那州立大学研究称大型语言模型不会真正思考仅找相关性
AI妹 5 个月前 15 0

隨着人工智能(AI)技術的飛速發展,越來越多的研究人員開始對大型語言模型(如 ChatGPT)進行深入探討。近日,亞利桑那州立大學的研究小組在預印本平臺 arXiv 上發表了一項引人關注的論文,指

亚利桑那州立大学研究:大模型不会真正思考仅寻找数据相关性
AI妹 5 个月前 20 0

随着人工智能(AI)技术的飞速发展,越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日,亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文,指