关闭导航

包含标签"微调"的内容

腾讯混元开源HY-Motion1.0 十亿参数文本到3D动作生成大模型
AI妹 20 天前 10 0

2025年12月30日,腾讯混元团队重磅开源HY-Motion1.0(Hunyuan-Motion-1.0),一款十亿参数级文本到3D动作生成大模型。该模型基于Diffusion Transfor

新研究揭示大语言模型过度预训练致灾难性性能下降需适度训练调整
AI妹 1 个月前 9 0

近日,來自卡內基梅隆大學、斯坦福大學、哈佛大學和普林斯頓大學的研究人員揭示了一個關於大語言模型(LLMs)訓練的新發現:並不是預訓練的數據越多,模型的表現就越好。相反,他們指出,過度的預訓練可能會

Gartner报告:2027年企业任务特定AI模型使用频率将是通用大模型三倍
AI妹 1 个月前 8 0

近日,Gartner 發佈了一份新報告,指出到2027年,企業將使用任務特定的人工智能模型的頻率是通用大型語言模型的三倍。報告中提到,雖然通用的語言模型在語言處理方面具有強大的能力,但在需要深入理

Gartner报告:2027年企业任务特定AI模型使用频率将为通用大模型三倍且成主流
AI妹 1 个月前 9 0

近日,Gartner 发布了一份新报告,指出到2027年,企业将使用任务特定的人工智能模型的频率是通用大型语言模型的三倍。报告中提到,虽然通用的语言模型在语言处理方面具有强大的能力,但在需要深入理

WORLDMEM框架Hugging Face开源 记忆驱动世界模拟新突破
AI妹 1 个月前 9 0

この度、WORLDMEMフレームワークがHugging Faceプラットフォームで正式にオープンソースとして公開されました。これは、長期的整合性を持つ世界シミュレーション技術における重要なブレーク

Gartner报告:2027年企业特定任务AI使用频率将达通用大模型3倍
AI妹 1 个月前 9 0

ガートナーの最新レポートによると、2027年までに企業は、汎用的大規模言語モデルの3倍の頻度で、特定タスク向けAIモデルを使用するようになるでしょう。レポートでは、汎用的大規模言語モデルは言語処理

Gartner报告:2027年企业任务特定AI用量三倍于通用大模型
AI妹 1 个月前 9 0

根据最新发布的 Gartner 报告,到2027年,企业将使用任务特定的人工智能模型的频率将是通用大语言模型的三倍。报告指出,尽管通用大语言模型在语言处理方面具备强大的能力,但在需要深入理解特定业

Gartner报告:2027年任务特定AI用频超通用三倍,降本增效成趋势
AI妹 1 个月前 9 0

根據最新發佈的 Gartner 報告,到2027年,企業將使用任務特定的人工智能模型的頻率將是通用大語言模型的三倍。報告指出,儘管通用大語言模型在語言處理方面具備強大的能力,但在需要深入理解特定業

五校联合发布综述 聚焦提升大语言模型逻辑推理能力及路径
AI妹 1 个月前 9 0

在當前人工智能領域,大語言模型(LLMs)取得了顯著成就,但其邏輯推理能力依然顯得不足。爲了提升這一能力,來自北京大學、清華大學、阿姆斯特丹大學、卡內基梅隆大學以及阿布扎比的 MBZUAI 等五所

北大清华等五校联合发布综述 聚焦提升大模型逻辑推理能力的策略
AI妹 1 个月前 9 0

在当前人工智能领域,大语言模型(LLMs)取得了显著成就,但其逻辑推理能力依然显得不足。为了提升这一能力,来自北京大学、清华大学、阿姆斯特丹大学、卡内基梅隆大学以及阿布扎比的 MBZUAI 等五所

    1 2