关闭导航

包含标签"MoE模型"的内容

阿里云通义千问Qwen3系列发布:覆盖全场景性能领先部署支持丰富
AI妹 5 个月前 14 0

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备

Qwen3系列大型语言模型开源发布 性能领先支持119种语言
AI妹 5 个月前 14 0

在全球人工智能領域,Qwen 系列大型語言模型迎來了新成員 ——Qwen3的發佈。今日,通義宣佈將 Qwen3開源,帶來了令人振奮的技術革新。 此次發佈的旗艦模型 Qwen3-235B-A22B

DeepSeek发布大语言模型部署新专利 提升资源利用率与系统性能
AI妹 5 个月前 16 0

Recently, DeepSeek's affiliated company —— Hangzhou DeepSeek Artificial Intelligence Basic Technol

华为FlashComm技术以三项创新实现大模型推理速度最高提升80%
AI妹 5 个月前 17 0

In the wave of global artificial intelligence development, the speed and efficiency of model infer

华为数学团队推出FlashComm技术 三大创新大幅提升大模型推理性能最高达80%
AI妹 5 个月前 17 0

在全球人工智能發展的浪潮中,模型推理的速度和效率愈發成爲焦點。近期,華爲的數學團隊在 DeepSeek 開源週期間推出了名爲 FlashComm 的新技術,旨在通過三項創新措施,大幅提升大模型推理

华为数学团队推出FlashComm技术 三项创新大幅提升大模型推理性能最高达80%
AI妹 5 个月前 19 0

在全球人工智能发展的浪潮中,模型推理的速度和效率愈发成为焦点。近期,华为的数学团队在 DeepSeek 开源周期间推出了名为 FlashComm 的新技术,旨在通过三项创新措施,大幅提升大模型推理

腾讯云Hunyuan-A13B模型API发布 MoE架构高性价比成优势
AI妹 5 个月前 16 0

このたび、騰訊クラウドの公式ウェブサイトでは、騰訊・ホンイェンA13BモデルのAPIサービスが正式にリリースされ、入力料金は100万トークンあたり0.5元、出力料金は100万トークンあたり2元と設

「シリコンクラウド正式发布Kimi K2模型 1T参数128K上下文新用户赠14元」
AI妹 5 个月前 16 0

このたび、シリコンクラウド(SiliconCloud)プラットフォームは、月の暗面がオープンソースで公開したMoEモデルKimi K2を正式にリリースしました。このモデルのパラメータ総数は1Tであ

硅基流动上线Kimi K2模型(1T/128K上下文)表现出色新用户享14元试用
AI妹 5 个月前 17 0

近日,硅基流動(SiliconCloud)平臺正式上線了月之暗面開源的 MoE 模型 Kimi K2。這款模型總參數達到1T,激活參數爲32B,在各項基準性能測試中表現不俗,能夠與頂尖的商業模型相

快手开源KAT-V1自动思考大模型 40B版性能超多款主流模型可体验
AI妹 5 个月前 17 0

快手公司正式發佈並開源了 KAT-V1自動思考(AutoThink)大模型。這款模型在思考和非思考能力的融合方面表現卓越,能夠根據問題的複雜度自動調整其思考模式。 KAT-V1共有兩個版本,分別

    1 2