关闭导航

包含标签"强化学习(RLHF)"的内容

前沿AI战略模拟研究揭示核危机博弈模型行为特征及新重要安全启示
AI妹 1 个月前 2 0

2026年2月16日,伦敦国王学院研究员Kenneth Payne发布了一项备受瞩目的AI战略模拟研究成果。该研究通过构建三阶段认知架构(反思、预测、信号/行动),令GPT-5.2、Claude

腾讯混元开源HY-Motion1.0 十亿参数文本到3D动作生成大模型
AI妹 3 个月前 13 0

2025年12月30日,腾讯混元团队重磅开源HY-Motion1.0(Hunyuan-Motion-1.0),一款十亿参数级文本到3D动作生成大模型。该模型基于Diffusion Transfor