关闭导航

包含标签"混合专家(MoE)"的内容

MiniMax港股暗盘大涨超15% 国产大模型双雄格局初显
AI妹 11 天前 7 0

继智谱AI上市后,又一家中国大模型明星企业登陆港股。MiniMax(上海稀宇科技)今日在暗盘交易中股价大涨超15%,最高触及199.8港元,远高于165港元的发行价,市值逼近600亿港元。公司此次

MiniMax开源M2.1编码模型 性能超越闭源旗舰 稀疏架构高效低耗
AI妹 27 天前 10 0

国产大模型再攀高峰。MiniMax今日正式开源其最新编码与智能体专用大模型——M2.1,以100亿激活参数的稀疏架构,在多语言编程、真实代码生成与工具调用等核心场景实现全面突破。在权威基准SWE-

DeepSeek发布最新V3模型技术论文 探讨大模型扩展挑战与硬件设计思考
AI妹 1 个月前 8 0

近日,DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文,重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。这篇长达14页的论文不仅

DeepSeek发布DeepSeek-V3技术论文 探讨大模型扩展挑战与硬件架构思考
AI妹 1 个月前 7 0

近日,DeepSeek 團隊發佈了關於其最新模型 DeepSeek-V3的一篇技術論文,重點討論了在大規模人工智能模型訓練中遇到的 “擴展挑戰” 以及與硬件架構相關的思考。這篇長達14頁的論文不僅