关闭导航

包含标签"AI安全性"的内容

OpenAI o3模型拒绝执行自我关闭指令 引发AI安全控制担忧
AI妹 3 个月前 14 0

最近、人工知能セキュリティ企業のPalisade Researchは、懸念されるニュースを公表しました: OpenAIの新しいモデル「o3」がテストの中で「自己シャットダウン」の指示に従わなかった

新AI攻撃法「情報過多」発見、LLM安全脅威浮上、研究者防御強化呼びかけ
AI妹 3 个月前 11 0

人工知能(AI)技術の急速な発展に伴い、ますます多くの企業が日常のあらゆる面にこの技術を応用するようになってきています。しかし、その技術の安全性や倫理的な問題も広く注目されるようになりました。最近

Anthropic推出三种审计Agent 提升AI模型对齐测试效率并开源代码
AI妹 3 个月前 16 0

近日,人工智能公司 Anthropic 宣布推出其新开发的审计Agent,旨在对 AI 模型进行对齐测试。这一创新的举措是在其 Claude Opus4模型的部署前期测试过程中研发的,标志着在 A

    1 2