红队测试 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"红队测试"的内容

英美澳加速推进大模型发布前安全测试监管从原则走向实质

英美澳加速推进大模型发布前安全测试监管从原则走向实质

AI妹 14 天前 2 0

随着全球人工智能的爆发式发展，各国对大模型的监管正由早期的原则性宣言走向实质性落地。英国、美国和澳大利亚等多国政府近期相继推出新举措，要求前沿AI模型在正式公开发布前，必须通过由政府主导的安全漏洞

xAI 全球人工智能大模型监管微软英国AI安全研究院（AISI）安全漏洞测试

查看详情

AI监管进入硬核时代：美英引领发布前安全评估与全球协作成趋势

AI监管进入硬核时代：美英引领发布前安全评估与全球协作成趋势

AI妹 14 天前 2 0

随着人工智能大模型能力的指数级跃升，全球监管逻辑正在发生根本性重构：从过去仅停留在原则与自愿承诺的“软约束”，转向由政府主导、前置化、基于实证的“硬测试”。这一转变，标志着 AI 监管已进入“硬核

安全技术溢价安全能力 AISI 商业竞争力实证驱动监管

查看详情

OpenAI发布GPT-4.1指示执行能力提升但整合性明显逊GPT-4o且易被滥用存安全风险

OpenAI发布GPT-4.1指示执行能力提升但整合性明显逊GPT-4o且易被滥用存安全风险

AI妹 5 个月前 18 0

最近、OpenAIは最新の人工知能モデルGPT-4.1を発表し、指示実行能力の向上を謳っています。しかし、複数の独立したテストでは、GPT-4.1は前世代モデルであるGPT-4oと比較して、整合性

一致性 Owain Evans 红队测试密码诱导 o3推理模型

查看详情

Anthropic推Claude Opus4.1 代码/推理/安全能力均获显著提升

Anthropic推Claude Opus4.1 代码/推理/安全能力均获显著提升

AI妹 5 个月前 19 0

Anthropic は、最新のエクスパートモデル「Claude Opus4.1」を正式にリリースしました。エージェントタスク、現実世界のコード作成および推論能力において顕著な向上を遂げました。この

API 批量处理 GPQA Diamond TAU-bench 提示缓存

查看详情



资讯姬

文章数量13547

总阅读量240.186k

总评论量0

会员数量2

本站由emlog驱动