大型语言模型 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"大型语言模型"的内容

阿里发布QwenLong-L1-32B 长文本推理模型实现重大突破

阿里发布QwenLong-L1-32B 长文本推理模型实现重大突破

AI妹 5 个月前 17 0

阿里巴巴今日正式发布QwenLong-L1-32B，这是一款专为长上下文推理设计的大型语言模型，标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A

技术标杆学术文献处理强化学习训练完整解决方案体系 Tongyi-Zhiwen

查看详情

阿里巴巴发布QwenLong-L1-32B 长上下文推理模型实现重大技术突破

阿里巴巴发布QwenLong-L1-32B 长上下文推理模型实现重大技术突破

AI妹 5 个月前 15 0

阿里巴巴今日正式發佈QwenLong-L1-32B，這是一款專爲長上下文推理設計的大型語言模型，標誌着AI長文本處理能力的重大突破。該模型在性能表現上超越了o3-mini和Qwen3-235B-A

长上下文推理 Tongyi-Zhiwen/QwenLong-L1 强化学习学术文献处理 DAPO

查看详情

西湖大学团队提出扩散式发散思维链提升扩散语言模型推理能力

西湖大学团队提出扩散式发散思维链提升扩散语言模型推理能力

AI妹 5 个月前 14 0

在近年来的人工智能研究中，思维链的概念越来越受到重视，尤其是在大型语言模型的训练和推理中。最近，西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”，这是一种为扩

数学推理线性思维链齐国君教授团队大型语言模型强化学习

查看详情

OpenAI发布HealthBench医疗评估数据集首次独立探索医疗领域

OpenAI发布HealthBench医疗评估数据集首次独立探索医疗领域

AI妹 5 个月前 18 0

OpenAI 正式发布了一个大型数据集，旨在评估大型语言模型在医疗健康领域回答问题的能力。这一项目被命名为 HealthBench，专家们对这一开源数据和详细的评估标准给予了高度赞誉，称其在规模和

评估标准大型语言模型开源数据 HealthBench 评估数据集

查看详情

OpenAI发布HealthBench医疗数据集首次独立探索医疗AI评估领域

OpenAI发布HealthBench医疗数据集首次独立探索医疗AI评估领域

AI妹 5 个月前 15 0

OpenAI 正式發佈了一個大型數據集，旨在評估大型語言模型在醫療健康領域回答問題的能力。這一項目被命名爲 HealthBench，專家們對這一開源數據和詳細的評估標準給予了高度讚譽，稱其在規模和

安全性 AGI 医疗AI技术 OpenAI HealthBench

查看详情

Meta研究：缩短推理链使AI准确率升34.5%，新方法降计算成本40%

Meta研究：缩短推理链使AI准确率升34.5%，新方法降计算成本40%

AI妹 5 个月前 16 0

近期，Meta 的 FAIR 團隊與耶路撒冷希伯來大學的研究人員聯合發佈了一項新研究，表明減少大型語言模型的推理時間可以顯著提高其在複雜推理任務中的表現。研究結果顯示，使用較短推理鏈的 AI 模型

大型语言模型 LLM 简化推理链条 Meta FAIR团队思考链条

查看详情

Meta联合研究：短推理链提升AI准确率34.5%并降低计算成本

Meta联合研究：短推理链提升AI准确率34.5%并降低计算成本

AI妹 5 个月前 17 0

近期，Meta 的 FAIR 团队与耶路撒冷希伯来大学的研究人员联合发布了一项新研究，表明减少大型语言模型的推理时间可以显著提高其在复杂推理任务中的表现。研究结果显示，使用较短推理链的 AI 模型

计算资源减少40% 计算成本降低耶路撒冷希伯来大学 short-m@k方法推理时间

查看详情

Ollama v0.8发布：流式传输、工具调用与性能优化赋能本地AI

Ollama v0.8发布：流式传输、工具调用与性能优化赋能本地AI

AI妹 5 个月前 18 0

Ollama官方宣佈推出其最新版本Ollama v0.8，爲本地運行大型語言模型（LLM）帶來了突破性升級。新版本引入了流式傳輸響應和工具調用功能，支持實時網絡搜索等交互場景，顯著提升了本地AI的

内存泄漏修复 AMD显卡支持流式传输响应实时交互本地AI

查看详情

亚利桑那州立大学研究称大型语言模型不会真正思考仅找相关性

亚利桑那州立大学研究称大型语言模型不会真正思考仅找相关性

AI妹 5 个月前 15 0

隨着人工智能（AI）技術的飛速發展，越來越多的研究人員開始對大型語言模型(如 ChatGPT)進行深入探討。近日，亞利桑那州立大學的研究小組在預印本平臺 arXiv 上發表了一項引人關注的論文，指

DeepSeek R1 相关性 ChatGPT 解释性人工智能亚利桑那州立大学

查看详情

亚利桑那州立大学研究：大模型不会真正思考仅寻找数据相关性

亚利桑那州立大学研究：大模型不会真正思考仅寻找数据相关性

AI妹 5 个月前 20 0

随着人工智能（AI）技术的飞速发展，越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日，亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文，指

人工智能 arxiv 解释性AI 亚利桑那州立大学 ChatGPT

查看详情

...

7



资讯姬

文章数量13538

总阅读量234.744k

总评论量0

会员数量2

本站由emlog驱动