关闭导航

包含标签"压力测试"的内容

全球首个人形机器人半马北京亦庄开赛 “天工”机器人夺冠创历史
AI妹 1 个月前 11 0

北京,2025年4月19日——今天,全球首个人形机器人半程马拉松在北京经济技术开发区(亦庄)正式开赛,标志着机器人技术与体育竞技的创新融合迈出历史性一步。 本次赛事吸引了近20支来自全球的人形机

OpenAI推“忏悔”机制 揭示AI潜在违规提升透明度 测试隐藏率仅4.4%
AI妹 1 个月前 20 0

近日,OpenAI 正在测试一种新方法,旨在揭示模型的潜在问题,比如奖励黑客行为或忽视安全规则。这一新机制被称为 “忏悔”,其核心理念是训练模型在单独的报告中承认规则违反,即使原始回答存在欺骗性,

研究发现大模型在死线KPI高压下性能暴跌 安全风险凸显需重视
AI妹 1 个月前 14 0

当大模型遇上“死线”与“KPI”,同样会“大脑宕机”。最新研究对 Google、Meta、OpenAI 等12款主流模型进行5874个高压场景测试,结果令人咋舌:Gemini2.5Pro 失败率从