关闭导航

包含标签"GPT-5"的内容

ESI-Bench:具身智能新标杆 揭示大模型空间交互致命短板
AI妹 15 天前 0 0

近日,李飞飞团队发布的 ESI-Bench(Embodied Spatial Intelligence Benchmark)引起了广泛关注。该基准不仅被誉为具身智能界的“ImageNet”,更深刻

GPT-5步入应用阶段 OpenAI爬虫活跃度大幅激增 数据采集成AI竞争新焦点
AI妹 1 个月前 2 0

随着GPT- 5 正式步入应用阶段,OpenAI在全球互联网上的数据采集力度达到了前所未有的高度。最新行业监测数据显示,自 2025 年 8 月新一代模型发布以来,OpenAI旗下爬虫程序的活跃度

微软开源多语言词嵌入新模型Harrier 支持超百种语言将集成至Bing及AI代理
AI妹 2 个月前 3 0

微软的 Bing 团队近日宣布开源其最新的词嵌入模型 “Harrier”。该模型在多语言 MTEB v2 基准测试中表现优异,支持超过 100 种语言,为用户提供了更为强大的语言处理能力。Ha

马斯克xAI最后联合创始人Tony Wu已离职 创始团队成立不到三年全流失
AI妹 2 个月前 3 0

马斯克旗下的 AI 公司 xAI 再次面临重大人事变动。公司最后一位联合创始人 Tony Wu 已于近日离开,这标志着 xAI 最初的创始团队在成立不到三年的时间里已全部流失。Tony Wu 此前

苹果联合威斯康星大学发布RubiCap框架 小模型低幻觉率超越千亿大模型
AI妹 2 个月前 3 0

在计算机视觉领域,如何让 AI 像人类一样观察并细致描述图片的每一个角落,一直是业内的难题。近日,苹果公司联合威斯康星大学麦迪逊分校,正式发布了一款名为 RubiCap

OpenAI终止Sora引行业巨震 迪士尼10亿泡汤微软关系降温
AI妹 2 个月前 3 0

全球 AI 视频领域的“天花板”意外折戟,这一变动正引发行业巨震。 当地时间周二, OpenAI 正式宣布将停止其视频生成工具 Sora 的后续

METR研究发现SWE-bench基准显著高估AI编程能力,人工评审采纳率差距明显
AI妹 2 个月前 4 0

研究机构 METR 最新发布的一项研究显示,被广泛用于评估 AI 编程能力的基准测试 SWE-bench Verified 可能显著高估了 AI 代理在真实软件开发环境中的表现。研究发现,在基准测

苹果AI最新研究:设计师反馈微调让小模型UI设计超越GPT-5获质的飞跃
AI妹 4 个月前 1157 0

苹果公司公布了一项令人瞩目的 AI 研究成果。该研究证明,通过引入专业设计师的直接反馈进行模型微调,生成式 AI 在界面设计(UI)任务上的表现能实现质的飞跃。令人惊讶的是,经过该方法优化的小参数

苹果团队魔改小模型 借专家深度反馈在UI生成领域击败GPT-5
AI妹 4 个月前 160 0

谁说“小模型”不能打败“大巨人”?近日, 苹果 UICoder 团队发布了一篇震撼 AI 界的最新研究论文,展示了他们如何通过

Sam Altman警示AI代理安全风险 GPT-5舍文采求逻辑 OpenAI首放缓员工增长
AI妹 4 个月前 34 0

OpenAI 首席执行官 Sam Altman 近日在开发者交流中发出严厉警告,称 AI 代理的强大功能与极高便利性,正诱使人类在缺乏安全基础设施的情况下赋予其过高控制权。奥特曼甚至以身说法,承认