关闭导航

包含标签"Chat-UniVi"的内容

字节跳动Vidi多模态模型:视频时间检索性能超GPT-4o
AI妹 1 个月前 10 0

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任