关闭导航

包含标签"2026Q1"的内容

腾讯发布混元2.0大模型 406B参数+256K窗口 推理增强多场景落地
AI妹 1 个月前 14 0

12月5日,腾讯正式发布新一代自研大模型——混元2.0(Tencent HY2.0),包括Think(推理增强版)与Instruct(指令遵循版)两个版本,总参数406B、激活32B,支持256K

美团LongCat发布WOWService大模型交互系统白皮书 智能客服全量上线成效显著
AI妹 1 个月前 13 0

美团LongCat Interaction团队发布WOWService大模型交互系统白皮书,披露已在美团智能客服全量上线的技术细节:通过“数据+知识双驱动”与四阶段训练体系,复杂业务场景下客服解决

AMD携手IBM与Zyphra发布全球首个全程AMD硬件训练的ZAYA1 MoE基础模型(14T tokens)
AI妹 1 个月前 13 0

AMD携手IBM与AI初创Zyphra发布ZAYA1——全球首个全程基于AMD硬件训练的MoE基础模型,预训练14T tokens,综合性能与Qwen3系列持平,数学/STEM推理未经指令微调即可