关闭导航

包含标签"混合专家模型"的内容

AMD推出vLLM-ATOM插件 助力Instinct GPU大模型推理高效提速
AI妹 28 天前 0 0

近日,AMD 正式发布了名为 vLLM-ATOM 的全新插件。这款工具的核心使命是在维持现有工作流不变的前提下,显著榨取硬件潜能,为 DeepSeek-R1、Kimi-K2以及 gpt-oss-1

腾讯开源混元Hy3 preview AI大模型 已在多平台上线并将覆盖更多产品
AI妹 1 个月前 3 0

在腾讯最新的人才引进和组织架构调整之后,4 月 23 日,腾讯正式发布并开源了其全新 AI 大模型 —— 混元 Hy3 preview。这一模型被称为 “混元重建后训练的第一个模型”,也是迄今为止

腾讯混元Hy3preview开源 实用性强 上下文推理智能体能力全面提升多业务接入
AI妹 1 个月前 3 0

4月23日,腾讯混元 Hy3preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K 上下文长度。这是混元重建后训练的第一个模型,也

谷歌Cloud Next '26发布构建代理企业的核心算力与软件基础设施
AI妹 1 个月前 3 0

在 Cloud Next '26 大会上,谷歌正式发布了一系列旨在构建“代理企业(The Agentic Enterprise)”的核心基础设施。此次更新涵盖了从

谷歌Gemma4开源模型参数量小性能强劲 支持移动设备高效应用
AI妹 2 个月前 3 0

谷歌近日正式发布了 Gemma4系列的开源模型,标志着人工智能领域的一次重大进步。这些模型的特别之处在于,某一款仅需激活3.8亿个参数,便能在权威榜单上超越体量是其20倍的其他大型模型。这意味着,

DeepSeek Engram模块:高效存储静态知识,提升LLM性能与长文本处理能力
AI妹 4 个月前 23 0

传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”,每次遇到相同的模式都需要重新计算,这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈,DeepSeek 的研究团队近日推出

阿里巴巴开源国内首个混合推理通义千问3模型 降本增效性能提升显
AI妹 5 个月前 19 0

阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R

通义App与网页版上线阿里千问3开源模型含多款尺寸性能提升
AI妹 5 个月前 17 0

4月29日,通義App與通義網頁版(tongyi.com)全面上線阿里新一代通義千問開源模型Qwen3(簡稱千問3)。用戶可以第一時間在通義App和網頁版中的專屬智能體“千問大模型”,以及主對話頁

Ollama全面支持阿里Qwen3模型 本地化部署高效性能出色
AI妹 5 个月前 19 0

Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態,爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇,顯著

阿里Qwen3:通义千问最新开源大模型,混合推理多模态全场景覆盖
AI妹 5 个月前 18 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密