视频问答 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"视频问答"的内容

VLM2Vec-V2：统一图像视频文档检索的优异多模态嵌入新框架

VLM2Vec-V2：统一图像视频文档检索的优异多模态嵌入新框架

AI妹 5 个月前 15 0

在多模态嵌入学习领域，研究人员们不断努力将不同的数据形式连接在一起，以便更好地理解和处理多样化的信息。近期，由 Salesforce Research、加州大学圣巴巴拉分校、滑铁卢大学及清华大学的

视频分类统一框架视频问答 Qwen2-VL 视觉文档检索

查看详情

VLM2Vec-V2：统一图像视频视觉文档检索的多模态嵌入框架

VLM2Vec-V2：统一图像视频视觉文档检索的多模态嵌入框架

AI妹 5 个月前 14 0

在多模態嵌入學習領域，研究人員們不斷努力將不同的數據形式連接在一起，以便更好地理解和處理多樣化的信息。近期，由 Salesforce Research、加州大學聖巴巴拉分校、滑鐵盧大學及清華大學的

MMEB 多模态旋转位置嵌入（M-RoPE）时间定位视频分类图像检索

查看详情

CameraBench：赋能AI精准理解镜头运动的创新研究成果

CameraBench：赋能AI精准理解镜头运动的创新研究成果

AI妹 5 个月前 19 0

咱们天天聊 AI 多牛逼，能写诗、能画画、还能跟你唠嗑到天亮。但你有没有想过，当 AI 看视频的时候，它真的“看懂”了吗? 你可能会说:“当然了，都能识别猫猫狗狗、人山人海了!” 打住!识别物

Pan USC 视频描述生成 COLMAP 平移

查看详情

AI镜头运动理解有新招！CameraBench数据集显威力

AI镜头运动理解有新招！CameraBench数据集显威力

AI妹 5 个月前 18 0

咱們天天聊 AI 多牛逼，能寫詩、能畫畫、還能跟你嘮嗑到天亮。但你有沒有想過，當 AI 看視頻的時候，它真的“看懂”了嗎? 你可能會說:“當然了，都能識別貓貓狗狗、人山人海了!” 打住!識別物

游戏 UMass VQA 镜頭运动 Zoom In/Out

查看详情

Meta发布五项AI感知前沿成果构建高级机器智能关键路径

Meta发布五项AI感知前沿成果构建高级机器智能关键路径

AI妹 5 个月前 18 0

Meta人工智能研究团队（FAIR）近日公开发布五项前沿研究成果，标志着AI感知领域的重大突破。这些开源项目从视觉编码器到3D空间理解，再到协作式推理框架，共同构建了通向高级机器智能(AMI)的关

检索任务鲁棒性合成数据协作推理器推理效率

查看详情

阿里南开联合发布LLaVA-Scissor 革新视频大模型压缩技术获佳绩

阿里南开联合发布LLaVA-Scissor 革新视频大模型压缩技术获佳绩

AI妹 5 个月前 16 0

最近、アリババ・テンユンラボと南開大学コンピューターサイエンス学部は、革新的な動画大規模モデル圧縮方法であるLLaVA-Scissorを共同で公開しました。この技術は、動画モデル処理における一連の

视频理解视频问答 SCC手法阿里巴巴·天韵实验室时空压缩策略

查看详情



资讯姬

文章数量13527

总阅读量230.286k

总评论量0

会员数量2

本站由emlog驱动