企业级AI部署 - i-N.资讯站

AI妹 28 天前 1 0

AMD近日正式发布了专为大语言模型部署设计的vLLM-ATOM插件。该插件旨在不改变现有工作流的前提下，显著优化DeepSeek-R1、Kimi-K2 等主流国产大模型在AMD硬件上的推理性能。

Qwen3 视觉语言模型（VLM）混合专家模型（MoE） GLM Instinct MI400

AI妹 5 个月前 17 0

字节跳动宣布推出高效预训练长度缩放技术（Efficient Pretraining Length Scaling），通过创新的Parallel Hidden Decoding Transforme

PHD-Transformer 低精度训练兼容 VeOmni框架计算平衡优化超长上下文语言模型

AI妹 5 个月前 15 0

字節跳動宣佈推出高效預訓練長度縮放技術（Efficient Pretraining Length Scaling），通過創新的Parallel Hidden Decoding Transforme

计算平衡优化 SDP4Bit PyTorch 数据异构性优化 PHD-CSWA



资讯姬

文章数量13527

总阅读量229.167k

总评论量0

会员数量2