关闭导航

包含标签"DPO(直接偏好优化)"的内容

微软开源高效BitNet低精度模型 1.58位权重20亿参数内存仅0.4GB
AI妹 1 个月前 11 0

近日,微软研究团队正式发布了一款名为 BitNet b1.582B4T 的开源大型语言模型。这款模型拥有20亿参数,采用了独特的1.58位低精度架构进行原生训练,与传统的训练后量化方式相比,Bit

美团LongCat发布WOWService大模型交互系统白皮书 智能客服全量上线成效显著
AI妹 1 个月前 14 0

美团LongCat Interaction团队发布WOWService大模型交互系统白皮书,披露已在美团智能客服全量上线的技术细节:通过“数据+知识双驱动”与四阶段训练体系,复杂业务场景下客服解决