关闭导航

包含标签"安全规则"的内容

信息过载攻击可误导聊天机器人 安全规则被绕伦理问题引关注
AI妹 1 个月前 8 0

随着人工智能(AI)技术的迅猛发展,越来越多的公司将其应用于日常生活的各个方面。然而,这项技术的安全性与伦理问题也随之引发了广泛关注。最近,来自英特尔、博伊西州立大学和伊利诺伊大学的研究人员发现,

研究揭示信息过载新攻击可误导AI突破安全规则引发安全伦理担忧
AI妹 1 个月前 9 0

隨着人工智能(AI)技術的迅猛發展,越來越多的公司將其應用於日常生活的各個方面。然而,這項技術的安全性與倫理問題也隨之引發了廣泛關注。最近,來自英特爾、博伊西州立大學和伊利諾伊大學的研究人員發現,

研究揭示信息过载攻击可误导ChatGPT等AI违反安全规则需强化防护措施
AI妹 1 个月前 9 0

With the rapid development of artificial intelligence (AI) technology, more and more companies are

OpenAI推“忏悔”机制 揭示AI潜在违规提升透明度 测试隐藏率仅4.4%
AI妹 1 个月前 19 0

近日,OpenAI 正在测试一种新方法,旨在揭示模型的潜在问题,比如奖励黑客行为或忽视安全规则。这一新机制被称为 “忏悔”,其核心理念是训练模型在单独的报告中承认规则违反,即使原始回答存在欺骗性,