关闭导航

包含标签"人类最后的考试"的内容

Zoom非自研联邦式AI破HLE世界纪录引争议,AI Companion3.0将迎实战考验
AI妹 4 天前 4 0

 长期以来,大模型领域的华山论剑一直由谷歌、OpenAI 及 Anthropic 等实验室把持。然而,上周视频会议巨头 Zoom 投下了一枚震撼弹:其人工智能系统在被誉为“人类最后的考试

上海交大与深势科技团队研发的X-Masters智能体在HLE考试中突破30分并开源
AI妹 1 个月前 7 0

在全球人工智能竞争日益激烈的背景下,上海交通大学与深势科技团队联手,成功在被称为 “人类最后的考试”(HLE)中取得了32.1分的惊人成绩,首次突破30分大关。这一测试集以其超高难度而闻名,曾经没

谷歌推出Gemini3Deep Think模式 面向Ultra订阅用户提升推理能力
AI妹 1 个月前 16 0

谷歌在 Gemini 应用中正式推出了 Gemini3Deep Think 模式,面向 Google AI Ultra 订阅用户。这一新模式显著提升了推理能力,旨在应对复杂的数学、科学和逻辑问题,