关闭导航

包含标签"视觉推理"的内容

美团发布全模态统一LongCat-Next原生多模态大模型 高效压缩性能领先并开源
AI妹 12 天前 2 0

4 月 3 日, 美团技术团队 正式发布原生多模态大模型 LongCat-Next 。该模型突破了传统“语言基座+插件”的拼凑架构,通过将

研究显示大模型视觉推理能力不及六岁儿童 暴露物理感知短板
AI妹 2 个月前 16 0

在人工智能屡屡斩获各类博士级竞赛桂冠的今天,我们似乎默认了这些数字大脑已经全方位超越人类。然而,一项由 UniPat AI、xbench、阿里、月之暗面以及阶跃星辰等多家顶尖机构联合发布的最新研究

2025多模态榜单:谷歌Gemini领先 国产商汤豆包跻身前三
AI妹 3 个月前 20 0

全球多模态大模型竞争格局再更新。近日,权威评测平台SuperCLUE-VLM发布2025年12月多模态视觉语言模型综合榜单,谷歌Gemini-3-Pro以83.64分断层领先,展现其在视觉理解与推

SuperCLUE-VLM12月测评:谷歌Gemini夺冠 国产模型跻身前三

(注:标题共29字,涵盖核心事件、冠军归属及国产模型亮眼表现,符合30字左右要求)
AI妹 3 个月前 15 0

在刚刚公布的 SuperCLUE-VLM12月多模态视觉语言基准测评中,全球 AI 大模型展现出了极强的竞争态势。本次测评从基础认知、视觉推理以及视觉应用三个核心维度展开,全方位考察了各大模型的“

豆包1.5深度思考及文生图3.0通过火山引擎开放API性能达业界前沿水平
AI妹 3 个月前 13 0

豆包大模型近日發佈了系列更新,其中豆包1.5·深度思考模型和豆包文生圖模型3.0正式通過火山引擎開放 API,供開發者和企業客戶使用。這兩款模型在推理任務和通用任務的綜合表現達到了業界前沿水平,並

豆包1.5深度思考及文生图3.0通过火山引擎开放API 性能达业界前沿
AI妹 3 个月前 15 0

豆包大模型近日发布了系列更新,其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API,供开发者和企业客户使用。这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平,并

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点
AI妹 3 个月前 15 0

【研究顛覆】 清華大學與上海交通大學聯合發表的最新論文,對業界普遍認爲"純強化學習(RL)能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現,引入強化學習的模型在某些任務中的表現,反而遜色於

清华上交联合研究挑战传统认知:纯RL难增强大模型推理能力学界热议
AI妹 3 个月前 14 0

【Research Upends Conventional Wisdom】 A recent joint paper from Tsinghua University and Shanghai

清华交大研究反驳纯RL提升大模型推理能力 实验揭示关键局限
AI妹 3 个月前 14 0

【研究颠覆】 清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于

昆仑万维开源Skywork-R1V2.0 多模态推理能力显著提升领跑中文场景推AGI
AI妹 3 个月前 17 0

4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场

    1 2