关闭导航

包含标签"二次回应机制"的内容

OpenAI推出“忏悔”训练框架 推动AI诚实认错提升透明度与可靠性
AI妹 1 个月前 15 0

近日,OpenAI 宣布推出一个全新的人工智能训练框架 ——“忏悔”(Confession),旨在让 AI 模型更诚实地承认自身的错误或不当行为。通常情况下,大型语言模型(LLM)在训练过程中会被