多模态模型训练 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"多模态模型训练"的内容

字节跳动PHD-Transformer：高效支持2M上下文LLM长序列预训练

字节跳动PHD-Transformer：高效支持2M上下文LLM长序列预训练

AI妹 1 个月前 8 0

字节跳动宣布推出高效预训练长度缩放技术（Efficient Pretraining Length Scaling），通过创新的Parallel Hidden Decoding Transforme

ByteScale框架强化学习数据异构性优化算法-系统协同设计 PHD-CSWA

查看详情

字节跳动PHD-Transformer：高效预训练长序列支持2M上下文提升LLM训练效率

字节跳动PHD-Transformer：高效预训练长序列支持2M上下文提升LLM训练效率

AI妹 1 个月前 8 0

字節跳動宣佈推出高效預訓練長度縮放技術（Efficient Pretraining Length Scaling），通過創新的Parallel Hidden Decoding Transforme

Hugging Face ByteCheckpoint 计算平衡优化 Hailuo Image 上下文长度

查看详情

腾讯WeChat-YATT训练库发布解决多模态强化学习训练核心瓶颈

腾讯WeChat-YATT训练库发布解决多模态强化学习训练核心瓶颈

AI妹 1 个月前 7 0

騰訊近日發佈了基於Megatron-Core和SGLang/vLLM研發的大模型訓練庫WeChat-YATT（Yet Another Transformer Trainer），內部項目代號爲gCo

多模态模型训练 GenRM（生成式奖励模型）全员共存模式并行控制器 SGLang/vLLM

查看详情

腾讯发布WeChat-YATT训练库解决大模型强化学习多模态训练瓶颈提升效率

腾讯发布WeChat-YATT训练库解决大模型强化学习多模态训练瓶颈提升效率

AI妹 1 个月前 6 0

腾讯近日发布了基于Megatron-Core和SGLang/vLLM研发的大模型训练库WeChat-YATT（Yet Another Transformer Trainer），内部项目代号为gCo

动态采样串行调度机制 gCore 大模型训练库负载均衡

查看详情



资讯姬

文章数量9911

总阅读量91.869k

总评论量1

会员数量2

最新评论

emlog1 个月前

发表在：欢迎使用emlog

这是系统生成的演示评论

本站由emlog驱动