关闭导航

包含标签"视觉感知"的内容

奥比中光卡位物理AI新高地 构建视觉基础设施支撑产业发展
AI妹 15 天前 2 0

随着人工智能从虚拟数字世界向真实物理空间延伸,“物理AI”(Physical AI)已成为全球科技产业竞逐的新高地。在这一进程中,如何让机器人“看懂”并“感知”物理世界,成为了大模型落地的关键瓶颈

业界首个七体古文字识别基准Chronicles-OCR发布 推动数字人文技术突破
AI妹 21 天前 1 0

5月18日,腾讯混元、SSV数字文化实验室及SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学,正式发布了业界首个覆盖“七体之变”完整演化轨迹的中国古文字识别评测基准

千问开源Qwen3.6-35B-A3B MoE模型 编程领域获突破
AI妹 1 个月前 3 0

阿里巴巴千问大模型团队于2026年4月16日正式开源稀疏混合专家(MoE)模型 Qwen3.6-35B-A3B,标志着轻量级模型在智能体编程领域实现关键突破。 该模型总参数量为350亿,得益

腾讯推出国内首个AI浏览器“龙虾”QBotClaw 支持多模型API配置
AI妹 2 个月前 3 0

今日,腾讯正式发布国内首个AI驱动的浏览器产品“龙虾”QBotClaw,标志着浏览器正从单纯的网页访问工具演变为具备全场景感知与复杂任务执行能力的AI助理。 该产品核心亮点在于其极高的开放性,支

优必选开源具身智能大模型Thinker解决机器人核心关键问题推动行业发展
AI妹 4 个月前 15 0

在机器人技术日新月异的今天,优必选最新推出的开源具身智能大模型 Thinker,正如一颗耀眼的明星,照亮了工业人形机器人的未来。这个大模型的目标是解决当前机器人领域在空间理解和视觉感知等关键任务上

阶跃星辰开源Step3-VL-10B 小参数多模态跨级反超可端侧部署
AI妹 4 个月前 17 0

阶跃星辰 近日宣布开源其最新多模态视觉语言模型 Step3-VL-10B 。该模型仅凭10B 的参数规模,在多项基准测试中展现

声智科技全球首款声视融合多模态AI时尚耳机将登陆Kickstarter全球首发
AI妹 5 个月前 18 0

可穿戴设备迎来“感知革命”。中国AI声学领军企业声智科技(SoundAI)宣布,其全球首款多模态AI时尚耳机将于海外知名众筹平台Kickstarter全球首发。该产品突破传统耳机仅限音频交互的局限

阶跃星辰发布Step3大模型 7月31日开源并成立模芯生态创新联盟
AI妹 5 个月前 16 0

在2025世界人工智能大会(WAIC2025)前夕,阶跃星辰在上海发布了其新一代基础大模型 ——Step3。这款模型不仅在智能性上取得突破,还兼顾了推理效率,旨在为企业和开发者提供最优质的应用方案

OpenAI正式发布GPT-5模型 多领域表现顶尖 本周四起向用户开放
AI妹 5 个月前 17 0

在今日凌晨的直播活動中,OpenAI正式推出了備受矚目的GPT-5模型,宣稱其爲自家迄今爲止最出色的模型,在編程、數學、寫作、健康、視覺感知等多個領域均展現出頂尖實力。 OpenAI首席執行

OpenAI正式发布GPT-5模型 面向所有用户开放且多领域实力显著提升
AI妹 5 个月前 18 0

在今日凌晨的直播活动中,OpenAI正式推出了备受瞩目的GPT-5模型,宣称其为自家迄今为止最出色的模型,在编程、数学、写作、健康、视觉感知等多个领域均展现出顶尖实力。 OpenAI首席执行

    1 2