关闭导航

包含标签"并行解码"的内容

英伟达等研发Fast-dLLM 借KV缓存和平行解码提升扩散语言模型推理效率
AI妹 1 个月前 9 0

近日,英伟达、香港大学与麻省理工学院的研究团队联合发布了一种名为 Fast-dLLM 的创新技术,旨在提升扩散语言模型的推理效率。与传统的自回归模型不同,扩散语言模型采用逐步去除文本噪声的方式生成

蚂蚁发布业内首个100B离散扩散大语言模型LLaDA2.0 性能速度双提升
AI妹 1 个月前 19 0

在大语言模型技术发展的新潮流中,蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列,这是业内首个参数规模达到100B 的离散扩散大语言模型(dLLM)。这一创新的模型不仅打破了扩散模型难以规模化