关闭导航

包含标签" HellaSwag"的内容

腾讯WeDLM扩散语言模型:突破推理效率瓶颈 高效文本生成能力突出
AI妹 7 天前 6 0

腾讯微信 AI 团队发布了一种新型扩散语言模型框架 ——WeDLM(WeChat Diffusion Language Model)。该模型的设计旨在突破传统大型语言模型(如 GPT 系列)在并行

Hugging Face开源SmolLM3:3B参数性能近4B,双模式推理高效灵活
AI妹 1 个月前 9 0

Recently, Hugging Face officially launched the brand-new open-source language model SmolLM3, a lig