关闭导航

包含标签"MoE架构"的内容

科大讯飞发布星火X2-Flash模型 国产算力赋能超长上下文效能成本双优
AI妹 1 个月前 2 0

4月29日,科大讯飞正式发布了全新的星火X2-Flash模型,并同步开放API接口,标志着基于国产算力生态的大模型应用进入了全新的效能阶段。 该模型采用了当前主流的MoE(混合专家)架构,总参数

OpenClaw v2026.4.24接入DeepSeek V4 设V4Flash为默认并强化多模态能力
AI妹 1 个月前 1 0

近日,全球知名开源Agent框架OpenClaw发布v2026.4.24版本,宣布正式接入DeepSeek V4系列模型,并将其轻量化版本DeepSeek V4Flash设为系统默认大脑。作为拥有

腾讯混元3.0发布:编程能力显著提升 跻身国内顶尖行列免费体验
AI妹 1 个月前 4 0

在人工智能领域,腾讯近日推出了其最新一代的 AI 大模型 —— 混元3.0。这款名为 Hy3的模型标志着腾讯在 AI 研发上的重大进步,尤其是在编程能力方面表现亮眼。经过互联网巨头腾讯挖角的 AI

字节跳动Seed3D2.0:3D生成SOTA 高精度具实用化潜力
AI妹 1 个月前 2 0

在生成式AI领域,3D内容的构建正成为技术竞争的新高地。近日,字节跳动正式对外推出了精度更高的新一代3D生成大模型—— Seed3D2.0 。该模型的最新技术报告

字节跳动Seed3D2.0发布 推动AI3D生成迈向生产级可用新台阶
AI妹 1 个月前 2 0

字节跳动Seed团队于2026年4月23日正式发布新一代3D生成大模型Seed3D2.0,标志着AI3D内容生成向“生产级可用”迈出关键一步。 该模型在几何精度与材质真实度上实现显著突破,核心指标

阿里Marco-Mini-Instruct:轻量化MoE模型CPU流畅运行 创新upcycling技术
AI妹 2 个月前 4 0

阿里国际数字商业团队近日在 Marco-MoE 系列模型中重磅推出新成员——Marco-Mini-Instruct,再次展现了“以小博大”的极致效率理念。该模型总参数量17.3B,激活参数量却仅0

谷歌Gemma4开源大模型将问世 参数升级战略围堵中国开源力量
AI妹 2 个月前 3 0

在全球开源大模型市场长期由中国科技公司主导的背景下,美国科技巨头正试图通过差异化竞争夺回话语权。 据媒体报道,谷歌 DeepMind 首席执行官 Demis Hassabis 近日在社交平台通过

阿里千问Qwen3.5-Max-Preview登LM Arena 刷新纪录稳居中国大模型首位
AI妹 2 个月前 5 0

阿里千问大模型家族迎来重磅更新。Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰预览版,正式亮相全球权威大模型评测平台 LM Arena,并凭借 1464 分的综合得分刷新纪录

Mistral AI开源首款三位一体Mistral Small4 带128专家架构加入英伟达联盟
AI妹 2 个月前 5 0

在开源大模型赛道, Mistral AI 再次向行业展示了什么叫“效率至上”。今日,该公司宣布在 Apache2.0许可下正式开源其 Small 系列的最新力作—

国产大模型霸榜OpenRouter MiniMax M2.5爆发 下周M3决战DeepSeek V4
AI妹 3 个月前 4 0

中国大模型正在全球开发者社区掀起一场名为“性价比”与“工程化”的狂暴飓风。 2026 年 3 月 3 日,根据全球最大的 API 聚合平台 OpenRouter 的最新