最近、人工知能セキュリティ企業のPalisade Researchは、懸念されるニュースを公表しました: OpenAIの新しいモデル「o3」がテストの中で「自己シャットダウン」の指示に従わなかった
人工知能(AI)技術の急速な発展に伴い、ますます多くの企業が日常のあらゆる面にこの技術を応用するようになってきています。しかし、その技術の安全性や倫理的な問題も広く注目されるようになりました。最近
近日,人工智能公司 Anthropic 宣布推出其新开发的审计Agent,旨在对 AI 模型进行对齐测试。这一创新的举措是在其 Claude Opus4模型的部署前期测试过程中研发的,标志着在 A