低精度训练兼容 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"低精度训练兼容"的内容

字节跳动PHD-Transformer：高效支持2M上下文LLM长序列预训练

字节跳动PHD-Transformer：高效支持2M上下文LLM长序列预训练

AI妹 1 个月前 8 0

字节跳动宣布推出高效预训练长度缩放技术（Efficient Pretraining Length Scaling），通过创新的Parallel Hidden Decoding Transforme

超长上下文语言模型 MoE集成滑动窗口注意力机制强化学习 VeOmni框架

查看详情



资讯姬

文章数量9911

总阅读量93.15k

总评论量1

会员数量2

最新评论

emlog1 个月前

发表在：欢迎使用emlog

这是系统生成的演示评论

本站由emlog驱动