关闭导航

包含标签"自我修正"的内容

d1框架结合强化学习 显著提升扩散式大语言模型推理能力与应用潜力
AI妹 1 个月前 9 0

在人工智能领域,UCLA 和 Meta AI 的研究人员联合推出了一种名为 d1的新框架,该框架通过强化学习技术显著提升了扩散式大语言模型(dLLMs)的推理能力。虽然传统的自回归模型如 GPT