vLLM推理框架 - i-N.资讯站

AI妹 28 天前 1 0

AMD近日正式发布了专为大语言模型部署设计的vLLM-ATOM插件。该插件旨在不改变现有工作流的前提下，显著优化DeepSeek-R1、Kimi-K2 等主流国产大模型在AMD硬件上的推理性能。

量化技术大语言模型部署 AMD Instinct MI400 Kimi-K2



资讯姬

文章数量13533

总阅读量232.256k

总评论量0

会员数量2