AI安全性 - i-N.资讯站

AI妹 5 个月前 18 0

最近、人工知能セキュリティ企業のPalisade Researchは、懸念されるニュースを公表しました: OpenAIの新しいモデル「o3」がテストの中で「自己シャットダウン」の指示に従わなかった

AIシステム AI安全性自己シャットダウン拒否事件 Gemini Google

AI妹 5 个月前 16 0

人工知能（AI）技術の急速な発展に伴い、ますます多くの企業が日常のあらゆる面にこの技術を応用するようになってきています。しかし、その技術の安全性や倫理的な問題も広く注目されるようになりました。最近

悪意の操作防御策情報過多攻撃 AI安全性大規模言語モデル

AI妹 5 个月前 21 0

近日，人工智能公司 Anthropic 宣布推出其新开发的审计Agent，旨在对 AI 模型进行对齐测试。这一创新的举措是在其 Claude Opus4模型的部署前期测试过程中研发的，标志着在 A

审计Agent 对齐验证效率工具使用调查Agent AI模型对齐测试 AI对齐问题



资讯姬

文章数量13541

总阅读量236.281k

总评论量0

会员数量2