关闭导航

包含标签"训练信号"的内容

谷歌DeepMind联合LIT AI实验室 以RLFT技术提升AI语言模型决策执行能力
AI妹 1 个月前 11 0

近期,谷歌 DeepMind 团队与约翰・开普勒林茨大学 LIT AI 实验室合作,开展了一项关于人工智能语言模型的新研究。他们采用了强化学习微调(RLFT)技术,旨在提升语言模型的决策能力。这项