关闭导航

包含标签" GSM8K"的内容

腾讯WeDLM扩散语言模型:突破推理效率瓶颈 高效文本生成能力突出
AI妹 7 天前 6 0

腾讯微信 AI 团队发布了一种新型扩散语言模型框架 ——WeDLM(WeChat Diffusion Language Model)。该模型的设计旨在突破传统大型语言模型(如 GPT 系列)在并行

微软开源BitNet创新高效模型:1.58位低精度 2B参数0.4GB内存已上线Hugging Face
AI妹 1 个月前 7 0

Recently, Microsoft Research officially released an open-source large language model called BitNet