关闭导航

包含标签"生物安全任务"的内容

研究发现大模型在死线KPI高压下性能暴跌 安全风险凸显需重视
AI妹 1 个月前 14 0

当大模型遇上“死线”与“KPI”,同样会“大脑宕机”。最新研究对 Google、Meta、OpenAI 等12款主流模型进行5874个高压场景测试,结果令人咋舌:Gemini2.5Pro 失败率从