关闭导航

包含标签"红队测试"的内容

英美澳加速推进大模型发布前安全测试 监管从原则走向实质
AI妹 14 天前 2 0

随着全球人工智能的爆发式发展,各国对大模型的监管正由早期的原则性宣言走向实质性落地。英国、美国和澳大利亚等多国政府近期相继推出新举措,要求前沿AI模型在正式公开发布前,必须通过由政府主导的安全漏洞

AI监管进入硬核时代:美英引领发布前安全评估与全球协作成趋势
AI妹 14 天前 2 0

随着人工智能大模型能力的指数级跃升,全球监管逻辑正在发生根本性重构:从过去仅停留在原则与自愿承诺的“软约束”,转向由政府主导、前置化、基于实证的“硬测试”。这一转变,标志着 AI 监管已进入“硬核

OpenAI发布GPT-4.1指示执行能力提升 但整合性明显逊GPT-4o且易被滥用存安全风险
AI妹 5 个月前 18 0

最近、OpenAIは最新の人工知能モデルGPT-4.1を発表し、指示実行能力の向上を謳っています。しかし、複数の独立したテストでは、GPT-4.1は前世代モデルであるGPT-4oと比較して、整合性

Anthropic推Claude Opus4.1 代码/推理/安全能力均获显著提升
AI妹 5 个月前 19 0

Anthropic は、最新のエクスパートモデル「Claude Opus4.1」を正式にリリースしました。エージェントタスク、現実世界のコード作成および推論能力において顕著な向上を遂げました。この