关闭导航

包含标签"3B模型"的内容

面壁智能联合清华等发布开源BitCPM-CANN 低比特大模型昇腾平台获突破
AI妹 14 天前 1 0

面壁智能近日联合清华大学、OpenBMB开源社区,正式发布并开源了在低比特大模型训练方向的最新突破成果——BitCPM-CANN。该成果在华为昇腾平台上原生完成,标志着端侧AI大模型在轻量化与工程

中国首个昇腾平台三值大模型BitCPM-CANN发布并开源
AI妹 15 天前 1 0

近日,面壁智能联合清华大学及 OpenBMB 开源社区,正式发布并开源了中国首个基于华为昇腾平台训练的三值(1.58-bit)大模型 ——BitCPM-CANN。该模型在低比特大模型训练领域取得了

法国Mistral AI推出Mistral3系列模型 开源128K上下文性能优价格仅GPT-4o一半
AI妹 6 个月前 37 0

法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型,包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3,覆盖从边缘设备到企业级推理的全场景