12月5日,腾讯正式发布新一代自研大模型——混元2.0(Tencent HY2.0),包括Think(推理增强版)与Instruct(指令遵循版)两个版本,总参数406B、激活32B,支持256K
美团LongCat Interaction团队发布WOWService大模型交互系统白皮书,披露已在美团智能客服全量上线的技术细节:通过“数据+知识双驱动”与四阶段训练体系,复杂业务场景下客服解决
AMD携手IBM与AI初创Zyphra发布ZAYA1——全球首个全程基于AMD硬件训练的MoE基础模型,预训练14T tokens,综合性能与Qwen3系列持平,数学/STEM推理未经指令微调即可
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论