关闭导航

包含标签"推理能力"的内容

微软开源MAI-DS-R1:敏感响应翻倍有害内容降50%安全可控
AI妹 3 个月前 12 0

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。 MA

微软开源MAI-DS-R1模型 敏感话题响应翻倍安全性增强多语言适配能力
AI妹 3 个月前 14 0

マイクロソフトは公式ウェブサイトで、DeepSeek-R1の改良版であるMAI-DS-R1を正式にオープンソース化しました。この新しいモデルは、元の推論性能を維持しながら、大幅な強化が施されており

清华上交联合研究挑战传统认知:纯RL难增强大模型推理能力学界热议
AI妹 3 个月前 15 0

【Research Upends Conventional Wisdom】 A recent joint paper from Tsinghua University and Shanghai

清华交大研究反驳纯RL提升大模型推理能力 实验揭示关键局限
AI妹 3 个月前 14 0

【研究颠覆】 清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于

火山引擎豆包1.5深層思考モデルがエッジLLMゲートウェイ上线、500万トークン無料提供
AI妹 3 个月前 11 0

4月25日、バイトダンス傘下の火山エンジンは、最新リリースの豆包1.5・深層思考モデルがエッジ大規模言語モデルゲートウェイに全面的に上线し、ユーザーに最大500万トークンの無料利用枠を提供すると発

火山引擎豆包1.5深度思考模型全面上线边缘网关 提供500万tokens免费额度
AI妹 3 个月前 14 0

4月25日,字節跳動旗下的火山引擎宣佈,其最新發佈的豆包1.5·深度思考模型已全面上線邊緣大模型網關,併爲用戶提供高達500萬tokens的免費使用額度,這一舉措在AI領域引起了廣泛關注。 豆包

通义千问Qwen3模型发布开源 多类型模型支持双思考模式赋能全球开发者
AI妹 3 个月前 22 0

通義千問團隊宣佈推出Qwen3,這是Qwen系列大型語言模型的最新成員。Qwen3系列模型在代碼、數學和通用能力等基準測試中表現出色,與DeepSeek-R1、o1、o3-mini、Grok-3和

通义千问团队推出Qwen3系列模型 开源多版本MoE及Dense模型赋能开发者
AI妹 3 个月前 26 0

通义千问团队宣布推出Qwen3,这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和

UCLA與Meta AI推出d1框架 強化學習提升擴散式大語言模型推理能力
AI妹 3 个月前 15 0

在人工智能領域,UCLA 和 Meta AI 的研究人員聯合推出了一種名爲 d1的新框架,該框架通過強化學習技術顯著提升了擴散式大語言模型(dLLMs)的推理能力。雖然傳統的自迴歸模型如 GPT

d1框架结合强化学习 显著提升扩散式大语言模型推理能力与应用潜力
AI妹 3 个月前 13 0

在人工智能领域,UCLA 和 Meta AI 的研究人员联合推出了一种名为 d1的新框架,该框架通过强化学习技术显著提升了扩散式大语言模型(dLLMs)的推理能力。虽然传统的自回归模型如 GPT