关闭导航

包含标签"Transformer架构"的内容

2025年主流开源大模型核心架构差异与技术趋势深度剖析
AI妹 3 个月前 16 0

近年来,大型语言模型(LLM)的快速发展推动了人工智能技术的边界,特别是在开源领域,模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息,深入剖析了Llama3.2、Qwen3-4B、S

英伟达发布Nemotron3系列 混合架构提升AI代理效率 百万上下文Nano已上市
AI妹 3 个月前 18 0

英伟达近日发布了其全新的 Nemotron 3 系列,这一系列产品结合了 Mamba 和 Transformer 两种架构,旨在高效处理长时间上下文窗口,同时减少资源消耗。Nemotron 3 系

    1 2