字節跳動Seed團隊在Hugging Face平臺重磅發佈BAGEL,一款基於混合專家(MoE)架構的開源多模態基礎模型,擁有14億總參數和7億活躍參數。BAGEL在數萬億token的交錯多模態數
字节跳动Seed团队在Hugging Face平台重磅发布BAGEL,一款基于混合专家(MoE)架构的开源多模态基础模型,拥有14亿总参数和7亿活跃参数。BAGEL在数万亿token的交错多模态数
腾讯近日宣布开源其全新语言模型“**混元-A13B**”,该模型引入了创新的**动态推理方法**,使其能够根据任务复杂性在快速和深度“思考”之间智能切换。 核心亮点:动态推理与MoE架构
来自中国初创公司 Moonshot AI 的开源大语言模型 Kimi K2在 OpenRouter 平台的 token 消耗量(市场份额指标)上迅速攀升,超越 xAI 的 Grok4和 OpenA
來自中國初創公司 Moonshot AI 的開源大語言模型 Kimi K2在 OpenRouter 平臺的 token 消耗量(市場份額指標)上迅速攀升,超越 xAI 的 Grok4和 OpenA
7月14日,Unsloth AI宣布成功将Moonshot AI的Kimi K2模型量化为1.8bit版本,大幅压缩模型体积并降低部署成本。根据AIbase报道,这一技术突破使Kimi K2从原始
7月14日,Unsloth AI宣佈成功將Moonshot AI的Kimi K2模型量化爲1.8bit版本,大幅壓縮模型體積並降低部署成本。根據AIbase報道,這一技術突破使Kimi K2從原始
TRAE.aiは、自社のカスタムモデルサービスプロバイダーにKimiを追加し、Kimi-K2モデルを正式リリースしたことを発表しました。また、国際版ではスーパーモデルであるGrok-4(ベータ)も
近日,Aider Leaderboard公佈了最新測試結果,Moonshot AI推出的開源模型Kimi K2在編程任務中表現出色,編程能力與Qwen3-235B-A22B相當,並接近o3-min
7月23日的清晨,阿里巴巴正式推出了其全新的开源 AI 编程模型 ——Qwen3-Coder。这款模型标志着千问系列中的一次重大突破,采用了混合专家(MoE)架构,拥有高达480亿的参数量,其中可