关闭导航

包含标签"8B模型"的内容

面壁智能联合清华等发布开源BitCPM-CANN 低比特大模型昇腾平台获突破
AI妹 14 天前 1 0

面壁智能近日联合清华大学、OpenBMB开源社区,正式发布并开源了在低比特大模型训练方向的最新突破成果——BitCPM-CANN。该成果在华为昇腾平台上原生完成,标志着端侧AI大模型在轻量化与工程

中国首个昇腾平台三值大模型BitCPM-CANN发布并开源
AI妹 15 天前 0 0

近日,面壁智能联合清华大学及 OpenBMB 开源社区,正式发布并开源了中国首个基于华为昇腾平台训练的三值(1.58-bit)大模型 ——BitCPM-CANN。该模型在低比特大模型训练领域取得了

阿里云Qwen3系列模型本周发布 多规模超256K上下文亮点纷呈
AI妹 5 个月前 13 0

阿里雲Qwen團隊通過社交平臺正式確認,Qwen3系列模型將於本週內發佈,標誌着其旗艦大語言模型(LLM)與多模態能力的又一次重大升級。據AIbase瞭解,Qwen3將推出包括0.6B、4B、8B

阿里云通义千问Qwen3系列发布:覆盖全场景性能领先部署支持丰富
AI妹 5 个月前 14 0

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备

法国Mistral AI推出Mistral3系列模型 开源128K上下文性能优价格仅GPT-4o一半
AI妹 6 个月前 35 0

法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型,包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3,覆盖从边缘设备到企业级推理的全场景