关闭导航

包含标签"Transformer架构"的内容

马斯克2026年1月开源X平台新一代推荐算法(Grok架构驱动)
AI妹 1 小时前 0 0

根据 AIbase 报道,埃隆·马斯克于2026年1月20日正式宣布开源 X 平台(原推特)的新一代推荐算法。此次开源的算法由 xAI 的 Grok 模型同款 Trans

英伟达发布PersonaPlex-7B-v1:全双工端到端语音对话模型支持个性化控制
AI妹 1 天前 1 0

英伟达 研究团队近日正式发布了名为 PersonaPlex-7B-v1 的全双工语音对语音对话模型。这款模型彻底打破了传统 AI 语音助手“听一句、回一句”的呆

雷蛇2026 CES发布AI开发者硬件:工作站、加速器及AIKit工具包
AI妹 13 天前 8 0

在2026年CES展会上,全球知名游戏与高性能硬件品牌雷蛇(Razer),正式进军AI开发者硬件市场。新产品线聚焦本地大模型(LLM),旨在为开发者、研究人员及中小企业提供高性能、高灵活性的AI基

OpenAI携手博通定制AI推理芯片 2026年部署欲挑战英伟达地位
AI妹 25 天前 10 0

在人工智能领域,OpenAI 与博通(Broadcom)达成了一项重大的合作,标志着传统 “仅使用 GPU” 的时代即将结束。双方已经完成了定制 AI 推理引擎的设计阶段,预计将在 2026 年下

微软发布BitNet b1.58-2B-4T 低精度高効率20亿参数模型
AI妹 1 个月前 10 0

先日、マイクロソフトの研究チームは、BitNet b1.582B4Tというオープンソースの大規模言語モデルを発表しました。このモデルは20億のパラメータを持ち、独自の1.58ビット低精度アーキテク

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 1 个月前 8 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越

2025年主流开源大模型核心架构差异与技术趋势深度剖析
AI妹 1 个月前 10 0

近年来,大型语言模型(LLM)的快速发展推动了人工智能技术的边界,特别是在开源领域,模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息,深入剖析了Llama3.2、Qwen3-4B、S

英伟达发布Nemotron3系列 混合架构提升AI代理效率 百万上下文Nano已上市
AI妹 1 个月前 13 0

英伟达近日发布了其全新的 Nemotron 3 系列,这一系列产品结合了 Mamba 和 Transformer 两种架构,旨在高效处理长时间上下文窗口,同时减少资源消耗。Nemotron 3 系