视频理解 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"视频理解"的内容

小米宣布开源最新一代多模态大模型MiMo-VL-7B-2508核心性能刷新纪录含双版本

小米宣布开源最新一代多模态大模型MiMo-VL-7B-2508核心性能刷新纪录含双版本

AI妹 5 个月前 19 0

小米大模型團隊宣佈開源最新一代多模態大模型 Xiaomi MiMo-VL-7B-2508，包含 RL 與 SFT 兩個版本。官方數據顯示，新版模型在學科推理、文檔理解、圖形界面定位及視頻理解四

文档理解 MiMo-VL-7B-RL-2508 VideoMME Xiaomi MiMo-VL-7B-2508 MMMU

查看详情

MiniCPM-V4.0视觉模型：OpenCompass高分移动流畅开源iOS应用易上手

MiniCPM-V4.0视觉模型：OpenCompass高分移动流畅开源iOS应用易上手

AI妹 5 个月前 17 0

在人工智能的持續發展中，最近一款新模型 MiniCPM-V4.0引起了廣泛關注。該模型是 MiniCPM-V 系列的最新版本，具有4.1億參數，基於 SigLIP2-400M 和 MiniCPM4

vLLM MiniCPM4-3B Llama.cpp MiniCPM-V4.0 4.1亿参数

查看详情

MiniCPM-V4.0：OpenCompass69分领先，移动适配佳开源iOS应用易上手

MiniCPM-V4.0：OpenCompass69分领先，移动适配佳开源iOS应用易上手

AI妹 5 个月前 18 0

在人工智能的持续发展中，最近一款新模型 MiniCPM-V4.0引起了广泛关注。该模型是 MiniCPM-V 系列的最新版本，具有4.1亿参数，基于 SigLIP2-400M 和 MiniCPM4

Cookbook OpenCompass评测得分69.0 解码速度响应延迟 OpenCompass

查看详情

X-SAM新型图像分割模型：实现从“分割万物”到“任意分割”的飞跃

X-SAM新型图像分割模型：实现从“分割万物”到“任意分割”的飞跃

AI妹 5 个月前 17 0

近日，中山大學、鵬城實驗室與美團聯合發佈了一項名爲 X-SAM 的新型圖像分割多模態大模型，標誌着圖像分割技術的一次重要進步。該模型的出現，不僅提高了圖像分割的精度，還實現了從 “分割萬物” 到

三阶段训练视觉查询统一分割解码器 X-SAM 文本查询

查看详情

Memories.ai获800万种子轮融资突破AI长视频上下文理解瓶颈

Memories.ai获800万种子轮融资突破AI长视频上下文理解瓶颈

AI妹 5 个月前 18 0

人工智能正在突破視頻理解的最後邊界。當前市面上的AI工具雖然能夠分析單個視頻並生成摘要，但面對數千小時的多視頻內容時卻顯得力不從心。這個技術瓶頸正困擾着安防公司和營銷企業，前者需要AI篩查海量監控

TwelveLabs 周恩民 Seedcamp 营销企业人形机器人

查看详情

字节跳动Vidi2模型：长视频理解强时空定位准性能领跑行业

字节跳动Vidi2模型：长视频理解强时空定位准性能领跑行业

AI妹 6 个月前 25 0

字节跳动刚刚发布了其最新的多模态大语言模型 Vidi2，一个拥有120亿参数、专用于视频理解的AI模型。该模型能够处理数小时长的原始素材，理解其中的故事脉络，并根据简单提示生成完整的TikTok短

高光提取视频理解超长视频理解技术架构 Gemma-3

查看详情

昆仑元AI发布昇腾平台全模态融合模型BaiZe-Omni-14b-a2b性能突出

昆仑元AI发布昇腾平台全模态融合模型BaiZe-Omni-14b-a2b性能突出

AI妹 6 个月前 25 0

在2025世界计算大会上，昆仑元 AI 正式发布了基于昇腾（Ascend）平台的全模态融合模型 BaiZe-Omni-14b-a2b。这一新模型具备强大的文本、音频、图像和视频理解与生成能力，采用

多线性注意力层昆仑元AI 音频理解昇腾平台音频生成

查看详情

3



资讯姬

文章数量13565

总阅读量243.735k

总评论量0

会员数量2

本站由emlog驱动