关闭导航

包含标签"置信度"的内容

英伟达等研发Fast-dLLM 借KV缓存和平行解码提升扩散语言模型推理效率
AI妹 1 个月前 9 0

近日,英伟达、香港大学与麻省理工学院的研究团队联合发布了一种名为 Fast-dLLM 的创新技术,旨在提升扩散语言模型的推理效率。与传统的自回归模型不同,扩散语言模型采用逐步去除文本噪声的方式生成