关闭导航

包含标签"UltraFeedback数据集"的内容

微软开源高效BitNet低精度模型 1.58位权重20亿参数内存仅0.4GB
AI妹 1 个月前 11 0

近日,微软研究团队正式发布了一款名为 BitNet b1.582B4T 的开源大型语言模型。这款模型拥有20亿参数,采用了独特的1.58位低精度架构进行原生训练,与传统的训练后量化方式相比,Bit

微软发布BitNet b1.58-2B-4T开源模型 20亿参数1.58位低精度内存仅0.4GB
AI妹 1 个月前 8 0

近日,微軟研究團隊正式發佈了一款名爲 BitNet b1.582B4T 的開源大型語言模型。這款模型擁有20億參數,採用了獨特的1.58位低精度架構進行原生訓練,與傳統的訓練後量化方式相比,Bit