关闭导航

包含标签" ARC"的内容

腾讯WeDLM扩散语言模型:突破推理效率瓶颈 高效文本生成能力突出
AI妹 6 天前 4 0

腾讯微信 AI 团队发布了一种新型扩散语言模型框架 ——WeDLM(WeChat Diffusion Language Model)。该模型的设计旨在突破传统大型语言模型(如 GPT 系列)在并行

卡内基梅隆等名校研究发现大语言模型过度预训练引发灾难性过训练
AI妹 1 个月前 7 0

Researchers from Carnegie Mellon University, Stanford University, Harvard University, and Princeto

Hugging Face开源SmolLM3:3B参数性能近4B,双模式推理高效灵活
AI妹 1 个月前 9 0

Recently, Hugging Face officially launched the brand-new open-source language model SmolLM3, a lig