关闭导航

包含标签"AI可控性"的内容

OpenAI o3模型拒绝自我关闭指令 引发AI安全可控性担忧
AI妹 1 个月前 8 0

最近,人工智能安全公司 Palisade Research 披露了一个令人担忧的消息:OpenAI 的新模型 o3在测试中拒绝了自我关闭的指令。这是首次观察到 AI 模型在明确指令下故意不遵守,打

Anthropic开源电路追踪工具 破解大模型黑盒助力AI透明可控发展
AI妹 1 个月前 9 0

近年來,大語言模型(LLM)的快速發展爲人工智能領域帶來了前所未有的突破,但其內部決策過程卻常常被視爲“黑盒子”,難以捉摸。5月29日,AI研究領域的明星公司Anthropic發佈了一項重大開源成