关闭导航

包含标签"监督微调"的内容

阿里Qwen推出WorldPM系列偏好模型 开源赋能全球开发者
AI妹 1 个月前 10 0

阿里巴巴旗下Qwen团队宣布推出全新偏好建模模型系列——WorldPM,包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和

阿里Qwen推出WorldPM偏好模型系列 开源赋能全球开发者
AI妹 1 个月前 10 0

阿里巴巴旗下Qwen團隊宣佈推出全新偏好建模模型系列——WorldPM,包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和

英伟达发布Cosmos-Reason1系列模型 提升AI物理推理及具身能力
AI妹 1 个月前 8 0

近日,英偉達發佈了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常識和具身推理方面的能力。隨着人工智能在語言處理、數學及代碼生成等領域取得顯著進展,如何將這些能力擴展到物理

英伟达Cosmos-Reason1模型增强AI物理与具身推理
AI妹 1 个月前 9 0

近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理

腾讯混元TurboS技术报告发布 创新架构及机制助力Chatbot Arena第七名
AI妹 1 个月前 8 0

腾讯发布了混元 TurboS 技术报告,揭示了其旗舰大语言模型 TurboS 的核心创新与强大能力。 根据全球权威大模型评测平台 Chatbot Arena 的最新排名,混元 TurboS 在2

Kimi K2技术报告揭秘:创新训练方法助其登顶全球开源模型竞赛
AI妹 1 个月前 9 0

Recently, the Kimi team officially released the technical report of Kimi K2, revealing the trainin

Kimi K2技术报告发布:万亿参数激活320亿,开源竞赛夺冠创新训练法
AI妹 1 个月前 10 0

近日,Kimi 团队正式发布了 Kimi K2的技术报告,揭示了这款全新模型背后的训练秘密。Kimi K2的参数总量达到1万亿,而激活参数则高达320亿,凭借其强大的能力,Kimi K2在刚上线一

快手发布Keye-VL-671B-A37B旗舰多模态模型 开放代码善看会想强化推理能力
AI妹 1 个月前 22 0

快手近日正式发布其新一代旗舰多模态模型 Keye-VL-671B-A37B,并同步开放代码。这一模型以其 “善看会想” 的特性,在通用视觉理解、视频分析和数学推理等多项核心 benchmark 中

    1 2