关闭导航

包含标签"视觉推理"的内容

英伟达发布首款全开源全模态物理人工智能大模型Cosmos3
AI妹 8 天前 2 0

物理人工智能领域迎来颠覆性突破。6月1日,英伟达正式发布了面向物理人工智能的开放世界基础大模型—— Cosmos3 。作为全球首款全开源、全模态的物理AI大模型,

SuperCLUE-VLM中文多模态测评:字节模型夺冠 国产模型表现亮眼仍需提升
AI妹 1 个月前 3 0

SuperCLUE-VLM 发布了最新的中文多模态视觉语言模型测评结果,标志着国内人工智能领域的一次重大突破。在此次评测中,字节跳动的 Doubao-Seed-2.0-Pro-260215 以 9

2026年4月SuperCLUE评测:国产多模态模型反超海外,字节跳动登顶
AI妹 1 个月前 2 0

根据SuperCLUE-VLM发布的2026年4月最新评测报告,中文多模态视觉语言模型领域发生了结构性变动。在对全球17款主流大模型进行的深度横评中,国产AI阵营表现出极强的爆发力,不仅在中文语境

美团发布全模态统一LongCat-Next原生多模态大模型 高效压缩性能领先并开源
AI妹 2 个月前 4 0

4 月 3 日, 美团技术团队 正式发布原生多模态大模型 LongCat-Next 。该模型突破了传统“语言基座+插件”的拼凑架构,通过将

研究显示大模型视觉推理能力不及六岁儿童 暴露物理感知短板
AI妹 4 个月前 19 0

在人工智能屡屡斩获各类博士级竞赛桂冠的今天,我们似乎默认了这些数字大脑已经全方位超越人类。然而,一项由 UniPat AI、xbench、阿里、月之暗面以及阶跃星辰等多家顶尖机构联合发布的最新研究

2025多模态榜单:谷歌Gemini领先 国产商汤豆包跻身前三
AI妹 5 个月前 22 0

全球多模态大模型竞争格局再更新。近日,权威评测平台SuperCLUE-VLM发布2025年12月多模态视觉语言模型综合榜单,谷歌Gemini-3-Pro以83.64分断层领先,展现其在视觉理解与推

SuperCLUE-VLM12月测评:谷歌Gemini夺冠 国产模型跻身前三

(注:标题共29字,涵盖核心事件、冠军归属及国产模型亮眼表现,符合30字左右要求)
AI妹 5 个月前 18 0

在刚刚公布的 SuperCLUE-VLM12月多模态视觉语言基准测评中,全球 AI 大模型展现出了极强的竞争态势。本次测评从基础认知、视觉推理以及视觉应用三个核心维度展开,全方位考察了各大模型的“

豆包1.5深度思考及文生图3.0通过火山引擎开放API性能达业界前沿水平
AI妹 5 个月前 19 0

豆包大模型近日發佈了系列更新,其中豆包1.5·深度思考模型和豆包文生圖模型3.0正式通過火山引擎開放 API,供開發者和企業客戶使用。這兩款模型在推理任務和通用任務的綜合表現達到了業界前沿水平,並

豆包1.5深度思考及文生图3.0通过火山引擎开放API 性能达业界前沿
AI妹 5 个月前 18 0

豆包大模型近日发布了系列更新,其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API,供开发者和企业客户使用。这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平,并

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点
AI妹 5 个月前 17 0

【研究顛覆】 清華大學與上海交通大學聯合發表的最新論文,對業界普遍認爲"純強化學習(RL)能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現,引入強化學習的模型在某些任務中的表現,反而遜色於