MoE架构 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"MoE架构"的内容

科大讯飞发布星火X2-Flash模型国产算力赋能超长上下文效能成本双优

科大讯飞发布星火X2-Flash模型国产算力赋能超长上下文效能成本双优

AI妹 1 个月前 2 0

4月29日，科大讯飞正式发布了全新的星火X2-Flash模型，并同步开放API接口，标志着基于国产算力生态的大模型应用进入了全新的效能阶段。该模型采用了当前主流的MoE（混合专家）架构，总参数

科大讯飞 AstronClaw 华为昇腾910B 30B参数量 256K超长上下文

查看详情

OpenClaw v2026.4.24接入DeepSeek V4 设V4Flash为默认并强化多模态能力

OpenClaw v2026.4.24接入DeepSeek V4 设V4Flash为默认并强化多模态能力

AI妹 1 个月前 1 0

近日，全球知名开源Agent框架OpenClaw发布v2026.4.24版本，宣布正式接入DeepSeek V4系列模型，并将其轻量化版本DeepSeek V4Flash设为系统默认大脑。作为拥有

GitHub星标全球Agent生态位多配置文件独立无头模式坐标点击实时语音通话

查看详情

腾讯混元3.0发布：编程能力显著提升跻身国内顶尖行列免费体验

腾讯混元3.0发布：编程能力显著提升跻身国内顶尖行列免费体验

AI妹 1 个月前 4 0

在人工智能领域，腾讯近日推出了其最新一代的 AI 大模型 —— 混元3.0。这款名为 Hy3的模型标志着腾讯在 AI 研发上的重大进步，尤其是在编程能力方面表现亮眼。经过互联网巨头腾讯挖角的 AI

OpenAI GLM-5 腾讯 MoE架构 GLM-4.7

查看详情

字节跳动Seed3D2.0：3D生成SOTA 高精度具实用化潜力

字节跳动Seed3D2.0：3D生成SOTA 高精度具实用化潜力

AI妹 1 个月前 3 0

在生成式AI领域，3D内容的构建正成为技术竞争的新高地。近日，字节跳动正式对外推出了精度更高的新一代3D生成大模型—— Seed3D2.0 。该模型的最新技术报告

视觉语言模型（VLM）生成式AI 仿真场景构建字节跳动 MoE架构

查看详情

字节跳动Seed3D2.0发布推动AI3D生成迈向生产级可用新台阶

字节跳动Seed3D2.0发布推动AI3D生成迈向生产级可用新台阶

AI妹 1 个月前 3 0

字节跳动Seed团队于2026年4月23日正式发布新一代3D生成大模型Seed3D2.0，标志着AI3D内容生成向“生产级可用”迈出关键一步。该模型在几何精度与材质真实度上实现显著突破，核心指标

人类偏好率仿真训练火山方舟体验中心具身智能技术报告

查看详情

阿里Marco-Mini-Instruct：轻量化MoE模型CPU流畅运行创新upcycling技术

阿里Marco-Mini-Instruct：轻量化MoE模型CPU流畅运行创新upcycling技术

AI妹 2 个月前 4 0

阿里国际数字商业团队近日在 Marco-MoE 系列模型中重磅推出新成员——Marco-Mini-Instruct，再次展现了“以小博大”的极致效率理念。该模型总参数量17.3B，激活参数量却仅0

激活参数量 AIbase 上下文长度个人开发者 Marco-MoE系列

查看详情

谷歌Gemma4开源大模型将问世参数升级战略围堵中国开源力量

谷歌Gemma4开源大模型将问世参数升级战略围堵中国开源力量

AI妹 2 个月前 3 0

在全球开源大模型市场长期由中国科技公司主导的背景下，美国科技巨头正试图通过差异化竞争夺回话语权。据媒体报道，谷歌 DeepMind 首席执行官 Demis Hassabis 近日在社交平台通过

MoE架构开源生态开源大模型闭源商业模式参数与效率双拼

查看详情

阿里千问Qwen3.5-Max-Preview登LM Arena 刷新纪录稳居中国大模型首位

阿里千问Qwen3.5-Max-Preview登LM Arena 刷新纪录稳居中国大模型首位

AI妹 2 个月前 5 0

阿里千问大模型家族迎来重磅更新。Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰预览版，正式亮相全球权威大模型评测平台 LM Arena，并凭借 1464 分的综合得分刷新纪录

纯性能对比中国大模型首位 MoE架构千问3.5系列 LM Arena

查看详情

Mistral AI开源首款三位一体Mistral Small4 带128专家架构加入英伟达联盟

Mistral AI开源首款三位一体Mistral Small4 带128专家架构加入英伟达联盟

AI妹 2 个月前 5 0

在开源大模型赛道， Mistral AI 再次向行业展示了什么叫“效率至上”。今日，该公司宣布在 Apache2.0许可下正式开源其 Small 系列的最新力作—

可配置推理强度 Nemotron联盟 MoE架构 Mistral AI 三位一体多功能模型

查看详情

国产大模型霸榜OpenRouter MiniMax M2.5爆发下周M3决战DeepSeek V4

国产大模型霸榜OpenRouter MiniMax M2.5爆发下周M3决战DeepSeek V4

AI妹 3 个月前 4 0

中国大模型正在全球开发者社区掀起一场名为“性价比”与“工程化”的狂暴飓风。 2026 年 3 月 3 日，根据全球最大的 API 聚合平台 OpenRouter 的最新

GLM-5 Kimi K2.5 token消耗 MiniMax M2.5 智能体场景

查看详情

1

...



资讯姬

文章数量13527

总阅读量228.449k

总评论量0

会员数量2

本站由emlog驱动