登录之后可以开启更多功能哦
11月27日,DeepSeek 团队在 Hugging Face 扔出236B 参数巨兽——DeepSeek-Math-V2,采用 MoE 架构,活跃参数仅21B,上下文一口气拉到128K tok
这是系统生成的演示评论
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论