关闭导航

包含标签"事实准确性"的内容

法国Giskard研究:简短回答增模型幻想,语气措辞影响纠正能力
AI妹 1 个月前 7 0

近期,法国人工智能研究机构 Giskard 进行了一项关于语言模型的研究,结果表明,当用户要求简短回答时,许多语言模型更可能生成错误或误导性的信息。 该研究使用了多语言的 Phare 基准测试,

谷歌推Gemini Deep Research 基于Gemini3 Pro优化幻觉 与OpenAI竞逐代理AI赛道各有胜负
AI妹 1 个月前 14 0

就在OpenAI发布代号“Garlic”的GPT-5. 2 前夕,谷歌抢先一步推出其全新升级的AI研究代理——Gemini Deep Research。这款基于最新Gemini 3 Pro大模型构

谷歌FACTS基准评估AI事实性 顶尖模型准确率均未突破70%
AI妹 1 个月前 20 0

近日,谷歌的 FACTS 团队与数据科学单位 Kaggle 联合发布了 FACTS 基准套件,旨在填补当前 AI 模型评估中对事实准确性缺乏标准化的空白。该基准套件提供了一种全面的评估框架,特别适