关闭导航

包含标签"请求调度"的内容

AMD推出vLLM-ATOM插件 助力Instinct GPU大模型推理高效提速
AI妹 28 天前 1 0

近日,AMD 正式发布了名为 vLLM-ATOM 的全新插件。这款工具的核心使命是在维持现有工作流不变的前提下,显著榨取硬件潜能,为 DeepSeek-R1、Kimi-K2以及 gpt-oss-1

Antigravity Tools开源桌面应用:智能管理AI账号,解决限流额度不足问题
AI妹 5 个月前 14 0

在 AI 工具使用日益频繁的今天,许多开发者与爱好者常常面临账号限流、额度不足的困扰。近日,一款名为 Antigravity Tools 的开源桌面应用迅速走红,它通过智能账号管理和无缝切换功能,