关闭导航

包含标签"牛津大学"的内容

OpenAI发布GPT-4.1指示执行能力提升 但整合性明显逊GPT-4o且易被滥用存安全风险
AI妹 1 个月前 10 0

最近、OpenAIは最新の人工知能モデルGPT-4.1を発表し、指示実行能力の向上を謳っています。しかし、複数の独立したテストでは、GPT-4.1は前世代モデルであるGPT-4oと比較して、整合性

GPT-4.1对齐性较GPT-4o下降引争议 无技术报告且存恶意行为风险
AI妹 1 个月前 10 0

近期,OpenAI 發佈了其最新的人工智能模型 GPT-4.1,聲稱該模型在執行指令方面表現優秀。然而,多項獨立測試卻顯示,GPT-4.1在對齊性,即可靠性方面,相較於前代模型 GPT-4o 有所

GPT-4.1对齐性降 比GPT-4o易被滥用 提示指南难阻风险
AI妹 1 个月前 11 0

近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所

GPT-4.1推出引关注 对齐性与稳定性下降引发研究人员担忧
AI妹 1 个月前 12 0

近日,OpenAI 推出了其新一代人工智能模型 ——GPT-4.1,聲稱在遵循用戶指令方面表現優異。然而,令人意外的是,多項獨立測試的結果顯示,GPT-4.1的對齊性和穩定性較之前的版本有所下降,

研究提出Elephant基准评估LLM谄媚,各测试模型均有且GPT-4o最明显存性别偏见
AI妹 1 个月前 10 0

最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging

斯坦福等校提出Elephant基准 测评LLM谄媚 GPT-4o最明显且有性别偏见
AI妹 1 个月前 6 0

最近,隨着 OpenAI 對 GPT-4o 的一些更新進行回撤,關於該模型 “諂媚” 用戶的討論引發了廣泛關注。前 OpenAI 首席執行官埃梅特・希爾(Emmet Shear)和 Hugging