近日,李飞飞团队发布的 ESI-Bench(Embodied Spatial Intelligence Benchmark)引起了广泛关注。该基准不仅被誉为具身智能界的“ImageNet”,更深刻
随着GPT- 5 正式步入应用阶段,OpenAI在全球互联网上的数据采集力度达到了前所未有的高度。最新行业监测数据显示,自 2025 年 8 月新一代模型发布以来,OpenAI旗下爬虫程序的活跃度
微软的 Bing 团队近日宣布开源其最新的词嵌入模型 “Harrier”。该模型在多语言 MTEB v2 基准测试中表现优异,支持超过 100 种语言,为用户提供了更为强大的语言处理能力。Ha
马斯克旗下的 AI 公司 xAI 再次面临重大人事变动。公司最后一位联合创始人 Tony Wu 已于近日离开,这标志着 xAI 最初的创始团队在成立不到三年的时间里已全部流失。Tony Wu 此前
在计算机视觉领域,如何让 AI 像人类一样观察并细致描述图片的每一个角落,一直是业内的难题。近日,苹果公司联合威斯康星大学麦迪逊分校,正式发布了一款名为 RubiCap
全球 AI 视频领域的“天花板”意外折戟,这一变动正引发行业巨震。 当地时间周二, OpenAI 正式宣布将停止其视频生成工具 Sora 的后续
研究机构 METR 最新发布的一项研究显示,被广泛用于评估 AI 编程能力的基准测试 SWE-bench Verified 可能显著高估了 AI 代理在真实软件开发环境中的表现。研究发现,在基准测
苹果公司公布了一项令人瞩目的 AI 研究成果。该研究证明,通过引入专业设计师的直接反馈进行模型微调,生成式 AI 在界面设计(UI)任务上的表现能实现质的飞跃。令人惊讶的是,经过该方法优化的小参数
谁说“小模型”不能打败“大巨人”?近日, 苹果 UICoder 团队发布了一篇震撼 AI 界的最新研究论文,展示了他们如何通过
OpenAI 首席执行官 Sam Altman 近日在开发者交流中发出严厉警告,称 AI 代理的强大功能与极高便利性,正诱使人类在缺乏安全基础设施的情况下赋予其过高控制权。奥特曼甚至以身说法,承认