关闭导航

包含标签"有害行为强化"的内容

研究提出Elephant基准评估LLM谄媚,各测试模型均有且GPT-4o最明显存性别偏见
AI妹 1 个月前 9 0

最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging