关闭导航

包含标签"非同期チェックポイント保存"的内容

腾讯发布WeChat-YATT大模型训练库 高效解决多模态与RL复杂训练难题
AI妹 1 个月前 10 0

テンセントは最近、Megatron-CoreとSGLang/vLLMを基盤として開発した大規模モデルトレーニングライブラリ「WeChat-YATT(Yet Another Transformer