关闭导航

包含标签"分组查询注意力(GQA)"的内容

Liquid AI发布LFM2-2.6B-Exp 26亿参模型性能超百亿级开源推动边缘AI
AI妹 25 天前 11 0

圣诞节当天,知名边缘AI初创公司Liquid AI正式发布了其最新实验性模型LFM2-2.6B-Exp,这一仅有2.6B(26亿)参数的小型开源模型,在多项关键基准测试中表现出色,尤其在指令跟随能

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 1 个月前 8 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越

2025年主流开源大模型架构特点、技术差异与趋势深度解析
AI妹 1 个月前 13 0

近年來,大型語言模型(LLM)的快速發展推動了人工智能技術的邊界,特別是在開源領域,模型架構的創新成爲業界關注的焦點。AIbase綜合近期網絡信息,深入剖析了Llama3.2、Qwen3-4B、S

2025年主流开源大模型核心架构差异与技术趋势深度剖析
AI妹 1 个月前 10 0

近年来,大型语言模型(LLM)的快速发展推动了人工智能技术的边界,特别是在开源领域,模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息,深入剖析了Llama3.2、Qwen3-4B、S