关闭导航

包含标签"2500亿STEM训练token"的内容

腾讯开源混元-A13B:动态推理与MoE架构,性能媲美领先模型
AI妹 1 个月前 10 0

騰訊近日宣佈開源其全新語言模型“**混元-A13B**”,該模型引入了創新的**動態推理方法**,使其能夠根據任務複雜性在快速和深度“思考”之間智能切換。 核心亮點:動態推理與MoE架構

腾讯开源混元-A13B 动态推理MoE架构及超长上下文成核心亮点
AI妹 1 个月前 7 0

腾讯近日宣布开源其全新语言模型“**混元-A13B**”,该模型引入了创新的**动态推理方法**,使其能够根据任务复杂性在快速和深度“思考”之间智能切换。 核心亮点:动态推理与MoE架构