混合专家架构（MoE） - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"混合专家架构（MoE）"的内容

阿里全新开源AI编程模型Qwen3-Coder：MoE架构性能媲美顶尖且全球开发者可用

阿里全新开源AI编程模型Qwen3-Coder：MoE架构性能媲美顶尖且全球开发者可用

AI妹 3 个月前 51 0

7月23日的清晨，阿里巴巴正式推出了其全新的開源 AI 編程模型 ——Qwen3-Coder。這款模型標誌着千問系列中的一次重大突破，採用了混合專家（MoE）架構，擁有高達480億的參數量，其中可

3D物理模拟强化学习网页开发 HuggingFace 代码占比70%

查看详情

阿里Qwen3-Coder登顶Hugging Face开源编程模型榜首引行业关注

阿里Qwen3-Coder登顶Hugging Face开源编程模型榜首引行业关注

AI妹 3 个月前 14 0

在7月24日，全球最大的 AI 開源社區 Hugging Face 發佈了最新的大模型排行榜，令人矚目的阿里巴巴 Qwen3-Coder 成功登頂，成爲全球熱度最高的開源 AI 編程模型，甚至超越

中国开源模型 Gpt-4.1 Qwen3-Coder Aravind Srinivas 阿里巴巴

查看详情

阿里Qwen3-Coder登顶Hugging Face 成全球最热开源AI编程模型

阿里Qwen3-Coder登顶Hugging Face 成全球最热开源AI编程模型

AI妹 3 个月前 15 0

在7月24日，全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型排行榜，令人瞩目的阿里巴巴 Qwen3-Coder 成功登顶，成为全球热度最高的开源 AI 编程模型，甚至超越

阿里巴巴Qwen3-Coder 开源AI编程模型 Claude4 Hugging Face Clement Delangue

查看详情

腾讯发布混元2.0大模型 406B参数+256K窗口推理增强多场景落地

腾讯发布混元2.0大模型 406B参数+256K窗口推理增强多场景落地

AI妹 4 个月前 23 0

12月5日，腾讯正式发布新一代自研大模型——混元2.0（Tencent HY2.0），包括Think(推理增强版)与Instruct(指令遵循版)两个版本，总参数406B、激活32B，支持256K

元宝App 数学推导分段采样修正 Tool Use 腾讯云API

查看详情

3



资讯姬

文章数量11972

总阅读量195.283k

总评论量0

会员数量2

本站由emlog驱动