关闭导航

包含标签"分组查询注意力"的内容

Hugging Face发布SmolLM3开源模型 30亿参数性能超同类支持多语言长上下文
AI妹 1 个月前 8 0

近日,全球知名的大模型开放平台 Hugging Face 正式发布了其最新开源模型 ——SmolLM3。这款模型拥有30亿参数,尽管参数量相对较小,但其性能显著超过了同类的开源模型,如 Llama

Hugging Face发布SmolLM3:3B参数性能直逼4B的开源轻量语言模型
AI妹 1 个月前 9 0

近日,Hugging Face正式推出全新開源語言模型 SmolLM3,一款擁有3B參數的輕量級大語言模型(LLM),以其卓越性能和高效設計引發行業廣泛關注。SmolLM3不僅在多項基準測試中超越

法国Mistral AI推出Mistral3系列模型 开源128K上下文性能优价格仅GPT-4o一半
AI妹 1 个月前 17 0

法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型,包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3,覆盖从边缘设备到企业级推理的全场景