混合专家模型 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"混合专家模型"的内容

AMD推出vLLM-ATOM插件助力Instinct GPU大模型推理高效提速

AMD推出vLLM-ATOM插件助力Instinct GPU大模型推理高效提速

AI妹 28 天前 0 0

近日，AMD 正式发布了名为 vLLM-ATOM 的全新插件。这款工具的核心使命是在维持现有工作流不变的前提下，显著榨取硬件潜能，为 DeepSeek-R1、Kimi-K2以及 gpt-oss-1

推理效率缓存管理 GPT-OSS-120B 技术架构响应速度

查看详情

腾讯开源混元Hy3 preview AI大模型已在多平台上线并将覆盖更多产品

腾讯开源混元Hy3 preview AI大模型已在多平台上线并将覆盖更多产品

AI妹 1 个月前 3 0

在腾讯最新的人才引进和组织架构调整之后，4 月 23 日，腾讯正式发布并开源了其全新 AI 大模型 —— 混元 Hy3 preview。这一模型被称为 “混元重建后训练的第一个模型”，也是迄今为止

混元Hy3 preview 混合专家模型组织架构调整腾讯开源

查看详情

腾讯混元Hy3preview开源实用性强上下文推理智能体能力全面提升多业务接入

腾讯混元Hy3preview开源实用性强上下文推理智能体能力全面提升多业务接入

AI妹 1 个月前 3 0

4月23日，腾讯混元 Hy3preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型，总参数295B，激活参数21B，最大支持256K 上下文长度。这是混元重建后训练的第一个模型，也

CHSBO2025 腾讯核心业务接入 CodeBuddy 代码智能体 Hy-Backend

查看详情

谷歌Cloud Next '26发布构建代理企业的核心算力与软件基础设施

谷歌Cloud Next '26发布构建代理企业的核心算力与软件基础设施

AI妹 1 个月前 3 0

在 Cloud Next '26 大会上，谷歌正式发布了一系列旨在构建“代理企业（The Agentic Enterprise）”的核心基础设施。此次更新涵盖了从

数字员工 Agent Studio Gemini企业代理平台 Docs TPU8i

查看详情

谷歌Gemma4开源模型参数量小性能强劲支持移动设备高效应用

谷歌Gemma4开源模型参数量小性能强劲支持移动设备高效应用

AI妹 2 个月前 3 0

谷歌近日正式发布了 Gemma4系列的开源模型，标志着人工智能领域的一次重大进步。这些模型的特别之处在于，某一款仅需激活3.8亿个参数，便能在权威榜单上超越体量是其20倍的其他大型模型。这意味着，

开源模型行业标准测试稠密模型开发者工具物联网终端支持

查看详情

DeepSeek Engram模块：高效存储静态知识，提升LLM性能与长文本处理能力

DeepSeek Engram模块：高效存储静态知识，提升LLM性能与长文本处理能力

AI妹 4 个月前 23 0

传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”，每次遇到相同的模式都需要重新计算，这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈，DeepSeek 的研究团队近日推出

稀疏大语言模型 GSM8K 长文本处理 Deepseek MMLU

查看详情

阿里巴巴开源国内首个混合推理通义千问3模型降本增效性能提升显

阿里巴巴开源国内首个混合推理通义千问3模型降本增效性能提升显

AI妹 5 个月前 19 0

阿里巴巴正式推出新一代通义千问模型 Qwen3（千问3），并宣布其开源。阿里云表示，千问3是国内首个 “混合推理模型”，同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R

Qwen3 HuggingFace Agent中心转型 H20显卡密集模型

查看详情

通义App与网页版上线阿里千问3开源模型含多款尺寸性能提升

通义App与网页版上线阿里千问3开源模型含多款尺寸性能提升

AI妹 5 个月前 17 0

4月29日，通義App與通義網頁版（tongyi.com）全面上線阿里新一代通義千問開源模型Qwen3(簡稱千問3)。用戶可以第一時間在通義App和網頁版中的專屬智能體“千問大模型”，以及主對話頁

tongyi.com 通义APP Qwen3-235B-A22B 代码生成逻辑推理

查看详情

Ollama全面支持阿里Qwen3模型本地化部署高效性能出色

Ollama全面支持阿里Qwen3模型本地化部署高效性能出色

AI妹 5 个月前 19 0

Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態，爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇，顯著

代码生成推理模式开源模型生态 MoE 数学推理

查看详情

阿里Qwen3：通义千问最新开源大模型，混合推理多模态全场景覆盖

阿里Qwen3：通义千问最新开源大模型，混合推理多模态全场景覆盖

AI妹 5 个月前 18 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型（LLM），于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型，Qwen3包含8款不同规模的模型，涵盖稠密

魔搭社区混合推理混合专家模型 Qwen3-VL 长上下文处理

查看详情

1



资讯姬

文章数量13527

总阅读量228.449k

总评论量0

会员数量2

本站由emlog驱动