关闭导航

包含标签"Transformer架构"的内容

OpenAI携手博通定制AI推理芯片 2026年部署欲挑战英伟达地位
AI妹 5 个月前 19 0

在人工智能领域,OpenAI 与博通(Broadcom)达成了一项重大的合作,标志着传统 “仅使用 GPU” 的时代即将结束。双方已经完成了定制 AI 推理引擎的设计阶段,预计将在 2026 年下

微软发布BitNet b1.58-2B-4T 低精度高効率20亿参数模型
AI妹 5 个月前 19 0

先日、マイクロソフトの研究チームは、BitNet b1.582B4Tというオープンソースの大規模言語モデルを発表しました。このモデルは20億のパラメータを持ち、独自の1.58ビット低精度アーキテク

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 5 个月前 14 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越

2025年主流开源大模型核心架构差异与技术趋势深度剖析
AI妹 5 个月前 18 0

近年来,大型语言模型(LLM)的快速发展推动了人工智能技术的边界,特别是在开源领域,模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息,深入剖析了Llama3.2、Qwen3-4B、S

英伟达发布Nemotron3系列 混合架构提升AI代理效率 百万上下文Nano已上市
AI妹 5 个月前 22 0

英伟达近日发布了其全新的 Nemotron 3 系列,这一系列产品结合了 Mamba 和 Transformer 两种架构,旨在高效处理长时间上下文窗口,同时减少资源消耗。Nemotron 3 系

    1 2