关闭导航

包含标签"分组查询注意力机制"的内容

Hugging Face发布SmolLM3开源模型 30亿参数性能超同类支持多语言长上下文
AI妹 1 个月前 8 0

近日,全球知名的大模型开放平台 Hugging Face 正式发布了其最新开源模型 ——SmolLM3。这款模型拥有30亿参数,尽管参数量相对较小,但其性能显著超过了同类的开源模型,如 Llama

Hugging Face发布SmolLM3 30亿参数模型 性能超同类且支持多语言
AI妹 1 个月前 7 0

近日,全球知名的大模型開放平臺 Hugging Face 正式發佈了其最新開源模型 ——SmolLM3。這款模型擁有30億參數,儘管參數量相對較小,但其性能顯著超過了同類的開源模型,如 Llama

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 1 个月前 8 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越