OLMo-1B - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"OLMo-1B"的内容

新研究揭示大语言模型过度预训练致灾难性性能下降需适度训练调整

新研究揭示大语言模型过度预训练致灾难性性能下降需适度训练调整

AI妹 1 个月前 8 0

近日，來自卡內基梅隆大學、斯坦福大學、哈佛大學和普林斯頓大學的研究人員揭示了一個關於大語言模型（LLMs）訓練的新發現:並不是預訓練的數據越多，模型的表現就越好。相反，他們指出，過度的預訓練可能會

性能下降渐进敏感性大语言模型灾难性过度训练微调

查看详情



资讯姬

文章数量9902

总阅读量89.003k

总评论量1

会员数量2

最新评论

emlog1 个月前

发表在：欢迎使用emlog

这是系统生成的演示评论

本站由emlog驱动