关闭导航

包含标签"幻觉率"的内容

OpenAI新推論モデルo3/o4-mini幻覚率33%/48%で問題深刻化
AI妹 1 个月前 10 0

最近、OpenAIは最新のo3とo4-mini AIモデルを発表しましたが、多くの点で最先端の技術に達している一方、「幻覚」の問題が改善どころか、OpenAIの以前の複数のモデルよりも深刻化してい

OpenAI o3/o4-mini模型幻觉率达33%/48% 较前代大幅上升
AI妹 1 个月前 9 0

最近,OpenAI 推出了其最新的 o3和 o4-mini AI 模型,这些模型在许多方面都达到了尖端水平。然而,新的模型在 “幻觉” 问题上却并没有改善,反而幻觉现象比 OpenAI 之前的多个

万众期待的GPT-5周四直播将亮相 性能飞跃或成AI重要里程碑
AI妹 1 个月前 9 0

根据 OpenAI 官方在 X 平台发布的预告以及多位高管的暗示,万众期待的 GPT-5 模型似乎即将在本周四的直播活动中正式亮相。这一消息迅速在科技界引发热议,人们普遍猜测,这款新一代大模型将带

GPT-5或本周四直播亮相 性能多维度升级有望引领AI行业新变革
AI妹 1 个月前 9 0

根據 OpenAI 官方在 X 平臺發佈的預告以及多位高管的暗示,萬衆期待的 GPT-5 模型似乎即將在本週四的直播活動中正式亮相。這一消息迅速在科技界引發熱議,人們普遍猜測,這款新一代大模型將帶

OpenAI发布GPT-5:解析特性价格版本能力及业界看法汇总
AI妹 1 个月前 11 0

AIBase | 2025年8月8日報道 2025年8月7日,OpenAI正式發佈了其最新一代人工智能模型GPT-5,這一發布標誌着生成式AI領域的又一里程碑。作爲OpenAI迄今爲止最強大

首个应用型AI翻译测评榜单TransBench发布 引入新指标成行业清晰可靠参考标准
AI妹 1 个月前 6 0

在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,

首个应用型AI翻译测评榜TransBench正式发布 各模型表现及新指标引行业关注
AI妹 1 个月前 8 0

在全球 AI 翻譯技術迅速發展的背景下,首個應用型 AI 翻譯測評榜單 TransBench 正式發佈。這一榜單由阿里國際 AI Business 團隊、上海人工智能實驗室和北京語言大學聯合推出,

GPT-5.2专业领域表现超顶尖专家 常识推理短板引发用户争议
AI妹 1 个月前 11 0

在 OpenAI 庆祝十周年之际,最新发布的 GPT-5.2 系列模型引发了广泛讨论。官方数据显示,GPT-5.2 在多个专业基准测试中表现出色,甚至在某些领域超过了人类专家,堪称迄今为止在专业知