关闭导航

包含标签"资源利用率最大化"的内容

Moonshot AI与清华联合提出PrfaaS 大幅提升大模型推理性能
AI妹 2 天前 1 0

大语言模型(LLM)的推理性能瓶颈正在被新技术打破。近日,Moonshot AI(月之暗面)与清华大学研究团队联合提出了一种名为**预填充即服务(PrfaaS)**的新型架构。该研究旨在通过优化算