关闭导航

包含标签"PersonQA基准测试"的内容

OpenAI新推論モデルo3/o4-mini幻覚率33%/48%で問題深刻化
AI妹 1 个月前 11 0

最近、OpenAIは最新のo3とo4-mini AIモデルを発表しましたが、多くの点で最先端の技術に達している一方、「幻覚」の問題が改善どころか、OpenAIの以前の複数のモデルよりも深刻化してい

OpenAI新推理模型o3/o4-mini幻覺率高达33%/48%成行业新挑战
AI妹 1 个月前 10 0

最近,OpenAI 推出了其最新的 o3和 o4-mini AI 模型,這些模型在許多方面都達到了尖端水平。然而,新的模型在 “幻覺” 問題上卻並沒有改善,反而幻覺現象比 OpenAI 之前的多個

OpenAI o3/o4-mini模型幻觉率达33%/48% 较前代大幅上升
AI妹 1 个月前 10 0

最近,OpenAI 推出了其最新的 o3和 o4-mini AI 模型,这些模型在许多方面都达到了尖端水平。然而,新的模型在 “幻觉” 问题上却并没有改善,反而幻觉现象比 OpenAI 之前的多个