关闭导航

包含标签"大规模推理任务"的内容

字节跳动Seed团队PHD-Transformer:新策略突破预训练长度限制有效解决KV缓存问题
AI妹 1 个月前 10 0

近日,字节跳动的 Seed 团队在人工智能领域再传佳音,推出了一种新型的 PHD-Transformer(Parallel Hidden Decoding Transformer),这项创新突破了