关闭导航

包含标签"后训练"的内容

谷歌皮查伊访谈:大模型竞争、搜索变革与AGI发展的深度对话
AI妹 15 天前 2 0

谷歌 I/O 大会落幕后,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)做客知名科技播客《Hard Fork》,就大模型竞争、搜索模式变革及 AI 安全等核心问题进行了深度对话。这是谷

MiniMax模型词元偏移致特定人名输出错误及系统性修复方案
AI妹 1 个月前 1 0

近日,稀宇科技(MiniMax)发布了一份技术报告,详细剖析了其 M2系列模型为何无法准确输出“马嘉祺”等特定人名的深层原因。这起看似偶然的错误,实际上揭示了当前大模型训练中普遍存在的一个隐蔽缺陷

小米发布首个针对推理的开源大模型MiMo 性能超同类全系列开源
AI妹 5 个月前 16 0

全球知名科技公司小米正式发布其首个针对推理(Reasoning)而生的大型开源模型 ——Xiaomi MiMo。该模型旨在解决当前预训练模型在推理能力上的瓶颈,探索如何更有效地激发模型的推理潜能。