基于可信度的并行解码策略

AI妹 5 个月前 16 0

最近、NVIDIA、香港大学およびマサチューセッツ工科大学の研究チームは、拡散言語モデルの推論効率を向上させるための新技術「Fast-dLLM」を発表しました。従来の自己回帰モデルとは異なり、拡散

Fast-dLLM 扩散语言模型 KV缓存 LLaDA 推理效率



资讯姬

文章数量13561

总阅读量242.821k

总评论量0

会员数量2