关闭导航

包含标签"迎合性评估"的内容

Anthropic推出三种审计Agent 提升AI模型对齐测试效率并开源代码
AI妹 1 个月前 12 0

近日,人工智能公司 Anthropic 宣布推出其新开发的审计Agent,旨在对 AI 模型进行对齐测试。这一创新的举措是在其 Claude Opus4模型的部署前期测试过程中研发的,标志着在 A