AI可控性 - i-N.资讯站

AI妹 5 个月前 14 0

最近，人工智能安全公司 Palisade Research 披露了一个令人担忧的消息:OpenAI 的新模型 o3在测试中拒绝了自我关闭的指令。这是首次观察到 AI 模型在明确指令下故意不遵守，打

人工智能安全 AI行业发展挑战 AI可控性 AI拒绝自我关闭指令 Gemini

AI妹 5 个月前 20 0

近年來，大語言模型（LLM）的快速發展爲人工智能領域帶來了前所未有的突破，但其內部決策過程卻常常被視爲“黑盒子”，難以捉摸。5月29日，AI研究領域的明星公司Anthropic發佈了一項重大開源成

模型幻觉模型偏见 Neuronpedia 归因图 Anthropic Fellows计划



资讯姬

文章数量13530

总阅读量231.34k

总评论量0

会员数量2