关闭导航

包含标签"MoE基础模型"的内容

AMD携手IBM与Zyphra发布全球首个全程AMD硬件训练的ZAYA1 MoE基础模型(14T tokens)
AI妹 1 个月前 14 0

AMD携手IBM与AI初创Zyphra发布ZAYA1——全球首个全程基于AMD硬件训练的MoE基础模型,预训练14T tokens,综合性能与Qwen3系列持平,数学/STEM推理未经指令微调即可