显存利用率 - i-N.资讯站

AI妹 29 天前 1 0

近日，AMD 正式发布了名为 vLLM-ATOM 的全新插件。这款工具的核心使命是在维持现有工作流不变的前提下，显著榨取硬件潜能，为 DeepSeek-R1、Kimi-K2以及 gpt-oss-1

DeepSeek-R1 AI服务缓存管理高性能GPU计算卡 GPT-OSS-120B

AI妹 6 个月前 29 0

vLLM团队发布首个“全模态”推理框架vLLM-Omni，将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs，开发者可立即pip安装并调用

音频语音Codec模型 Docker Compose CUDA12.2 显存利用率



资讯姬

文章数量13565

总阅读量243.582k

总评论量0

会员数量2