小模型 - i-N.资讯站

AI妹 5 个月前 16 0

近日，字节跳动Seed团队携手香港大学与复旦大学，共同推出了创新的强化学习训练方法——POLARIS。该方法通过精心设计的Scaling RL策略，成功将小模型的数学推理能力提升至与超大模型相媲美

小模型 RoPE位置编码开源模型消费级显卡数学推理能力

AI妹 6 个月前 29 0

在人工智能领域，最近发生了一场激烈的竞争。英伟达的4B 小模型 NVARC 在最新的 ARC-AGI2评测中以27.64% 的优异成绩力压对手 GPT-5Pro 的18.3%，成功登顶。这一成就不

零预训练深度学习方法特定领域适应能力 TTFT技术 Megatron后端英伟达



资讯姬

文章数量13547

总阅读量240.186k

总评论量0

会员数量2