AI对齐 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"AI对齐"的内容

微软AI首席苏莱曼公开抨击Anthropic推测Claude有意识的行为非常危险

微软AI首席苏莱曼公开抨击Anthropic推测Claude有意识的行为非常危险

AI妹 3 小时前 1 0

微软人工智能首席执行官穆斯塔法·苏莱曼（Mustafa Suleyman）近日在播客节目《Decoder》中公开抨击竞争对手Anthropic，指其推测大模型Claude具有意识的行为“非常危险”

克劳德宪法微软 Claude 可控AI AI对齐

查看详情

Anthropic发布文章呼吁全球放缓前沿AI研发防范递归自我改进失控风险

Anthropic发布文章呼吁全球放缓前沿AI研发防范递归自我改进失控风险

AI妹 4 天前 1 0

在人工智能能力狂飙突进的当下，AI巨头Anthropic罕见地按下了“暂停键”。当地时间6月4日，Anthropic在官网发布了一篇题为《当AI构建自身》（When AI builds itsel

估值9650亿美元 AI失控风险 OpenAI IPO筹备暂停键

查看详情

OpenAI心理健康安全负责人瓦隆内离职加盟Anthropic对齐团队

OpenAI心理健康安全负责人瓦隆内离职加盟Anthropic对齐团队

AI妹 4 个月前 32 0

OpenAI 内部负责心理健康安全研究的关键人物安德莉亚·瓦隆内（Andrea Vallone）已正式离职。这位在 OpenAI 效力三年、曾主导 GPT-4 和

Anthropic Claude 微调技术安德莉亚·瓦隆内 GPT-5

查看详情

Anthropic研究揭示Claude超3000种价值观为AI对齐安全提供新见解

Anthropic研究揭示Claude超3000种价值观为AI对齐安全提供新见解

AI妹 5 个月前 15 0

近日，人工智能公司 Anthropic 公佈了一項重要研究，分析了其 AI 助手 Claude 在實際對話中所表達的價值觀。通過對70萬次匿名對話的深入分析，研究團隊揭示了 Claude 在不同情

AI对齐 Claude 商业环境社会影响团队 Claude Max

查看详情

Anthropic研究揭示Claude AI的3307种价值观为AI对齐安全提供新见解

Anthropic研究揭示Claude AI的3307种价值观为AI对齐安全提供新见解

AI妹 5 个月前 18 0

近日，人工智能公司 Anthropic 公布了一项重要研究，分析了其 AI 助手 Claude 在实际对话中所表达的价值观。通过对70万次匿名对话的深入分析，研究团队揭示了 Claude 在不同情

受监管行业 AI价值观社会性价值观用户赋能实际应用评估

查看详情



资讯姬

文章数量13548

总阅读量241.189k

总评论量0

会员数量2

本站由emlog驱动