智能体任务 - i-N.资讯站

AI妹 2 个月前 1067 0

传统 MoE（混合专家）架构通过增加专家数量提升模型能力，却常受困于边际收益递减与高昂的通信开销。今日，美团 LongCat 团队发布了全新模型 LongCat-Flash-Lite，

TerminalBench 代码能力 29亿至45亿激活参数 LongCat-Flash-Lite 685亿总参数

AI妹 3 个月前 53 0

7月23日的清晨，阿里巴巴正式推出了其全新的開源 AI 編程模型 ——Qwen3-Coder。這款模型標誌着千問系列中的一次重大突破，採用了混合專家（MoE）架構，擁有高達480億的參數量，其中可

编程任务 1M token扩展智能体任务开源AI编程模型混合专家架构（MoE）

AI妹 4 个月前 50 0

小米正式进军高性能开源大模型赛道。近日，公司发布了全新基础语言模型 MiMo-V2-Flash，并同步以 MIT协议全面开源模型权重与推理代码。该模型以“超高速、高效率”为核心卖点，在推理、代码

3090亿参数推理代码 MIT协议 150亿激活参数



资讯姬

文章数量11999

总阅读量201.722k

总评论量0

会员数量2