多模态理解 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"多模态理解"的内容

阿里Qwen团队发布Qwen3-Omni-Flash全模态大模型实现实时流式多模态交互

阿里Qwen团队发布Qwen3-Omni-Flash全模态大模型实现实时流式多模态交互

AI妹 6 个月前 23 0

AIbase12月9日报道阿里巴巴Qwen团队今日发布新一代全模态大模型Qwen3-Omni-Flash-2025-12-01。该模型支持文本、图像、音频和视频的无缝输入，并通过实时流式响应同步

语音识别御姐 API上线 Qwen3-Omni-Flash 70B轻量版

查看详情

快手可灵数字人2.0全面上线三步生成5分钟生动高表现力视频

快手可灵数字人2.0全面上线三步生成5分钟生动高表现力视频

AI妹 6 个月前 21 0

快手推出的可灵数字人2.0版本已全面上线，用户只需经过三个简单的步骤，就能生成一个 “能说会演” 的数字人。这一更新为用户带来了显著的体验提升。新版本的可灵数字人允许用户上传角色图片、添加

全面上线丰富情感动作创作者工具视频生成模型 AI算法

查看详情

谷歌Workspace Studio通用可用零代码AI代理开启企业自动化新征程

谷歌Workspace Studio通用可用零代码AI代理开启企业自动化新征程

AI妹 6 个月前 27 0

12月3日，谷歌正式宣布Google Workspace Studio通用可用，这款AI代理构建工具标志着企业自动化进入“零代码时代”。依托Gemini3的多模态理解能力，Workspace St

报告生成端到端自动化第三方集成零代码时代多模态理解

查看详情

快手发布Keye-VL-671B-A37B旗舰多模态模型开放代码善看会想强化推理能力

快手发布Keye-VL-671B-A37B旗舰多模态模型开放代码善看会想强化推理能力

AI妹 6 个月前 31 0

快手近日正式发布其新一代旗舰多模态模型 Keye-VL-671B-A37B，并同步开放代码。这一模型以其 “善看会想” 的特性，在通用视觉理解、视频分析和数学推理等多项核心 benchmark 中

视觉感知全面预训练通用多模态系统图表理解 MLP层

查看详情

4



资讯姬

文章数量13547

总阅读量240.63k

总评论量0

会员数量2

本站由emlog驱动