关闭导航

包含标签"混合专家架构"的内容

腾讯开源混元-A13B:动态推理与MoE架构,性能媲美领先模型
AI妹 5 个月前 20 0

騰訊近日宣佈開源其全新語言模型“**混元-A13B**”,該模型引入了創新的**動態推理方法**,使其能夠根據任務複雜性在快速和深度“思考”之間智能切換。 核心亮點:動態推理與MoE架構

腾讯开源混元-A13B 动态推理MoE架构高性能表现优异
AI妹 5 个月前 16 0

テンセントは最近、新しく開発した言語モデル「**混元-A13B**」をオープンソース化することを発表しました。このモデルには、タスクの複雑さに応じて迅速な思考と深く考える「思考」の間でスマートに切

月之暗面推出开源大语言模型Kimi K2 万亿参数智能体能力强
AI妹 5 个月前 15 0

中国人工智能企业月之暗面近日重磅推出其最新的开源大语言模型 ——Kimi K2。这一模型采用了混合专家架构,总参数量达到了惊人的1万亿,其中激活参数为320亿,表现出色,成为业内关注的焦点。 K

月之暗面发布开源大模型Kimi K2 万亿参数混合架构智能体能力强
AI妹 5 个月前 16 0

中國人工智能企業月之暗面近日重磅推出其最新的開源大語言模型 ——Kimi K2。這一模型採用了混合專家架構,總參數量達到了驚人的1萬億,其中激活參數爲320億,表現出色,成爲業內關注的焦點。 K

Perplexity CEO称赞月之暗面首个万亿参数开源模型Kimi K2,拟后续训练。
AI妹 5 个月前 14 0

近日,美國人工智能初創公司 Perplexity 的首席執行官阿拉溫德(Aravind Srinivas)在社交媒體上發佈了一則重要信息。他表示,該公司對 “月之暗面” 推出的 Kimi K2模型

Perplexity CEO称赞月之暗面Kimi K2 拟对该万亿参数开源模型后续训练
AI妹 5 个月前 14 0

近日,美国人工智能初创公司 Perplexity 的首席执行官阿拉温德(Aravind Srinivas)在社交媒体上发布了一则重要信息。他表示,该公司对 “月之暗面” 推出的 Kimi K2模型

Unsloth AI成功1.8bit量子化Kimi K2 体积大减性能不减
AI妹 5 个月前 15 0

7月14日、Unsloth AIはMoonshot AIのKimi K2モデルを1.8bitバージョンに量子化することに成功し、モデルの体積を大幅に圧縮し、導入コストを削減しました。AIbaseの

TRAE.ai新增Kimi-K2模型 國際版同步支持Grok-4(Beta)上線
AI妹 5 个月前 17 0

TRAE.ai 宣佈,旗下自定義模型服務商新增 Kimi,正式上線 Kimi-K2模型,並在國際版中支持超級模型 Grok-4(Beta)。這一創新舉措旨在滿足開發者對多樣性與專業性的日益增長的需

Mistral洽談10億美元融資 加速AIGC領域佈局展現強勁發展動能
AI妹 5 个月前 26 0

來自彭博社的消息稱,法國知名的大模型開源平臺 Mistral 正在與阿布扎比的 MGX 基金以及法國的一些貸款機構進行洽談,計劃籌集一輪高達10億美元的融資。這一舉措表明 Mistral 正朝着快

英伟达与Mistral AI合作推出开放源多模态Mistral3模型家族含410亿参数
AI妹 6 个月前 21 0

近日,英伟达宣布与大型语言模型开发商 Mistral AI 达成合作,旨在加速开发和部署一系列新的开放源模型。根据双方的合作协议,英伟达将利用其强大的平台来支持 Mistral 最新推出的模型家族