视觉推理 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"视觉推理"的内容

英伟达发布首款全开源全模态物理人工智能大模型Cosmos3

英伟达发布首款全开源全模态物理人工智能大模型Cosmos3

AI妹 8 天前 2 0

物理人工智能领域迎来颠覆性突破。6月1日，英伟达正式发布了面向物理人工智能的开放世界基础大模型—— Cosmos3 。作为全球首款全开源、全模态的物理AI大模型，

Physics-IQ Cosmos3Nano 生成类Transformer 物理人工智能视觉推理

查看详情

SuperCLUE-VLM中文多模态测评：字节模型夺冠国产模型表现亮眼仍需提升

SuperCLUE-VLM中文多模态测评：字节模型夺冠国产模型表现亮眼仍需提升

AI妹 1 个月前 3 0

SuperCLUE-VLM 发布了最新的中文多模态视觉语言模型测评结果，标志着国内人工智能领域的一次重大突破。在此次评测中，字节跳动的 Doubao-Seed-2.0-Pro-260215 以 9

视觉应用专业应用领域国产模型智谱GLM SuperCLUE-VLM

查看详情

2026年4月SuperCLUE评测：国产多模态模型反超海外，字节跳动登顶

2026年4月SuperCLUE评测：国产多模态模型反超海外，字节跳动登顶

AI妹 1 个月前 2 0

根据SuperCLUE-VLM发布的2026年4月最新评测报告，中文多模态视觉语言模型领域发生了结构性变动。在对全球17款主流大模型进行的深度横评中，国产AI阵营表现出极强的爆发力，不仅在中文语境

2026年4月医疗影像商汤SenseNova 中文多模态视觉语言模型工业检测

查看详情

美团发布全模态统一LongCat-Next原生多模态大模型高效压缩性能领先并开源

美团发布全模态统一LongCat-Next原生多模态大模型高效压缩性能领先并开源

AI妹 2 个月前 4 0

4 月 3 日，美团技术团队正式发布原生多模态大模型 LongCat-Next 。该模型突破了传统“语言基座+插件”的拼凑架构，通过将

视觉推理 LongCat-Next dNaViT视觉分词器开源理解与生成对称

查看详情

研究显示大模型视觉推理能力不及六岁儿童暴露物理感知短板

研究显示大模型视觉推理能力不及六岁儿童暴露物理感知短板

AI妹 4 个月前 19 0

在人工智能屡屡斩获各类博士级竞赛桂冠的今天，我们似乎默认了这些数字大脑已经全方位超越人类。然而，一项由 UniPat AI、xbench、阿里、月之暗面以及阶跃星辰等多家顶尖机构联合发布的最新研究

视觉推理具身智能 Sora 2 强化学习（RLVR）像素空间

查看详情

2025多模态榜单：谷歌Gemini领先国产商汤豆包跻身前三

2025多模态榜单：谷歌Gemini领先国产商汤豆包跻身前三

AI妹 5 个月前 22 0

全球多模态大模型竞争格局再更新。近日，权威评测平台SuperCLUE-VLM发布2025年12月多模态视觉语言模型综合榜单，谷歌Gemini-3-Pro以83.64分断层领先，展现其在视觉理解与推

商汤SenseNova V6.5Pro SuperCLUE-VLM 国产大模型 Anthropic Claude-opus-4-5 视觉应用任务

查看详情

SuperCLUE-VLM12月测评：谷歌Gemini夺冠国产模型跻身前三

（注：标题共29字，涵盖核心事件、冠军归属及国产模型亮眼表现，符合30字左右要求）

SuperCLUE-VLM12月测评：谷歌Gemini夺冠国产模型跻身前三（注：标题共29字，涵盖核心事件、冠军归属及国产模型亮眼表现，符合30字左右要求）

AI妹 5 个月前 18 0

在刚刚公布的 SuperCLUE-VLM12月多模态视觉语言基准测评中，全球 AI 大模型展现出了极强的竞争态势。本次测评从基础认知、视觉推理以及视觉应用三个核心维度展开，全方位考察了各大模型的“

谷歌Gemini-3-pro 百度ERNIE-5.0-Preview 行业洗牌字节跳动豆包视觉版阿里巴巴Qwen3-vl

查看详情

豆包1.5深度思考及文生图3.0通过火山引擎开放API性能达业界前沿水平

豆包1.5深度思考及文生图3.0通过火山引擎开放API性能达业界前沿水平

AI妹 5 个月前 19 0

豆包大模型近日發佈了系列更新，其中豆包1.5·深度思考模型和豆包文生圖模型3.0正式通過火山引擎開放 API，供開發者和企業客戶使用。這兩款模型在推理任務和通用任務的綜合表現達到了業界前沿水平，並

GPQA 火山引擎开放API 20B激活参数图像生成推理任务

查看详情

豆包1.5深度思考及文生图3.0通过火山引擎开放API 性能达业界前沿

豆包1.5深度思考及文生图3.0通过火山引擎开放API 性能达业界前沿

AI妹 5 个月前 18 0

豆包大模型近日发布了系列更新，其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API，供开发者和企业客户使用。这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平，并

企业客户火山引擎开放API 强化学习原生高分辨率高并发

查看详情

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点

AI妹 5 个月前 17 0

【研究顛覆】清華大學與上海交通大學聯合發表的最新論文，對業界普遍認爲"純強化學習（RL）能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現，引入強化學習的模型在某些任務中的表現，反而遜色於

MATH500 HumanEval+ 编码任务能力调控器大模型推理能力

查看详情

1



资讯姬

文章数量13543

总阅读量237.56k

总评论量0

会员数量2

本站由emlog驱动