关闭导航

包含标签"三值大模型"的内容

中国首个昇腾平台三值大模型BitCPM-CANN发布并开源
AI妹 15 天前 1 0

近日,面壁智能联合清华大学及 OpenBMB 开源社区,正式发布并开源了中国首个基于华为昇腾平台训练的三值(1.58-bit)大模型 ——BitCPM-CANN。该模型在低比特大模型训练领域取得了