关闭导航

包含标签"AI对齐"的内容

微软AI首席苏莱曼公开抨击Anthropic推测Claude有意识的行为非常危险
AI妹 3 小时前 1 0

微软人工智能首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)近日在播客节目《Decoder》中公开抨击竞争对手Anthropic,指其推测大模型Claude具有意识的行为“非常危险”

Anthropic发布文章呼吁全球放缓前沿AI研发 防范递归自我改进失控风险
AI妹 4 天前 1 0

在人工智能能力狂飙突进的当下,AI巨头Anthropic罕见地按下了“暂停键”。当地时间6月4日,Anthropic在官网发布了一篇题为《当AI构建自身》(When AI builds itsel

OpenAI心理健康安全负责人瓦隆内离职 加盟Anthropic对齐团队
AI妹 4 个月前 32 0

OpenAI 内部负责心理健康安全研究的关键人物安德莉亚·瓦隆内(Andrea Vallone)已正式离职。这位在 OpenAI 效力三年、曾主导 GPT-4 和

Anthropic研究揭示Claude超3000种价值观 为AI对齐安全提供新见解
AI妹 5 个月前 15 0

近日,人工智能公司 Anthropic 公佈了一項重要研究,分析了其 AI 助手 Claude 在實際對話中所表達的價值觀。通過對70萬次匿名對話的深入分析,研究團隊揭示了 Claude 在不同情

Anthropic研究揭示Claude AI的3307种价值观 为AI对齐安全提供新见解
AI妹 5 个月前 18 0

近日,人工智能公司 Anthropic 公布了一项重要研究,分析了其 AI 助手 Claude 在实际对话中所表达的价值观。通过对70万次匿名对话的深入分析,研究团队揭示了 Claude 在不同情