关闭导航

包含标签"256000トークン上下文窗口"的内容

腾讯开源混元-A13B 动态推理MoE架构高性能表现优异
AI妹 1 个月前 9 0

テンセントは最近、新しく開発した言語モデル「**混元-A13B**」をオープンソース化することを発表しました。このモデルには、タスクの複雑さに応じて迅速な思考と深く考える「思考」の間でスマートに切