关闭导航

包含标签"企业级AI部署"的内容

AMD发布vLLM-ATOM插件 显著优化主流国产大模型在其GPU上的推理性能
AI妹 28 天前 1 0

AMD近日正式发布了专为大语言模型部署设计的vLLM-ATOM插件。该插件旨在不改变现有工作流的前提下,显著优化DeepSeek-R1、Kimi-K2 等主流国产大模型在AMD硬件上的推理性能。

字节跳动PHD-Transformer:高效支持2M上下文LLM长序列预训练
AI妹 5 个月前 17 0

字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transforme

字节跳动PHD-Transformer:高效预训练长序列 支持2M上下文提升LLM训练效率
AI妹 5 个月前 15 0

字節跳動宣佈推出高效預訓練長度縮放技術(Efficient Pretraining Length Scaling),通過創新的Parallel Hidden Decoding Transforme