关闭导航

包含标签"级联On-Policy蒸馏"的内容

阿里Marco-Mini-Instruct:轻量化MoE模型CPU流畅运行 创新upcycling技术
AI妹 5 天前 0 0

阿里国际数字商业团队近日在 Marco-MoE 系列模型中重磅推出新成员——Marco-Mini-Instruct,再次展现了“以小博大”的极致效率理念。该模型总参数量17.3B,激活参数量却仅0