关闭导航

包含标签"分布式训练"的内容

腾讯WeChat-YATT训练库发布 解决多模态强化学习训练核心瓶颈
AI妹 1 个月前 7 0

騰訊近日發佈了基於Megatron-Core和SGLang/vLLM研發的大模型訓練庫WeChat-YATT(Yet Another Transformer Trainer),內部項目代號爲gCo

腾讯发布WeChat-YATT训练库 解决大模型强化学习多模态训练瓶颈提升效率
AI妹 1 个月前 6 0

腾讯近日发布了基于Megatron-Core和SGLang/vLLM研发的大模型训练库WeChat-YATT(Yet Another Transformer Trainer),内部项目代号为gCo

Hugging Face发布SmolLM3开源模型 30亿参数性能超同类支持多语言长上下文
AI妹 1 个月前 9 0

近日,全球知名的大模型开放平台 Hugging Face 正式发布了其最新开源模型 ——SmolLM3。这款模型拥有30亿参数,尽管参数量相对较小,但其性能显著超过了同类的开源模型,如 Llama

腾讯战略性调整大模型研发架构 成立三大部门并任命核心团队
AI妹 1 个月前 12 0

腾讯近日宣布对其大模型研发架构进行战略性调整,通过成立 AI Infra部、AI Data部及数据计算平台部,全面强化大模型的核心研发体系。据 AIbase 报道,此次升级旨在构建从底层算力基础设