分布式训练 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"分布式训练"的内容

腾讯WeChat-YATT训练库发布解决多模态强化学习训练核心瓶颈

腾讯WeChat-YATT训练库发布解决多模态强化学习训练核心瓶颈

AI妹 5 个月前 18 0

騰訊近日發佈了基於Megatron-Core和SGLang/vLLM研發的大模型訓練庫WeChat-YATT（Yet Another Transformer Trainer），內部項目代號爲gCo

异步Checkpoint保存多模态场景可扩展性瓶颈并行控制器部分共存策略 Actor Rollouts

查看详情

腾讯发布WeChat-YATT训练库解决大模型强化学习多模态训练瓶颈提升效率

腾讯发布WeChat-YATT训练库解决大模型强化学习多模态训练瓶颈提升效率

AI妹 5 个月前 15 0

腾讯近日发布了基于Megatron-Core和SGLang/vLLM研发的大模型训练库WeChat-YATT（Yet Another Transformer Trainer），内部项目代号为gCo

部分共存策略串行调度机制 GenRM 大数据集多模态场景

查看详情

Hugging Face发布SmolLM3开源模型 30亿参数性能超同类支持多语言长上下文

Hugging Face发布SmolLM3开源模型 30亿参数性能超同类支持多语言长上下文

AI妹 5 个月前 16 0

近日，全球知名的大模型开放平台 Hugging Face 正式发布了其最新开源模型 ——SmolLM3。这款模型拥有30亿参数，尽管参数量相对较小，但其性能显著超过了同类的开源模型，如 Llama

SmolLM3 AdamW优化器 transformer解码器文档内掩码技术架构细节

查看详情

腾讯战略性调整大模型研发架构成立三大部门并任命核心团队

腾讯战略性调整大模型研发架构成立三大部门并任命核心团队

AI妹 5 个月前 22 0

腾讯近日宣布对其大模型研发架构进行战略性调整，通过成立 AI Infra部、AI Data部及数据计算平台部，全面强化大模型的核心研发体系。据 AIbase 报道，此次升级旨在构建从底层算力基础设

数据智能融合平台刘煜宏数据评测体系全链路竞争力大模型研发架构调整

查看详情



资讯姬

文章数量13527

总阅读量227.547k

总评论量0

会员数量2

本站由emlog驱动