Vidi - i-N.资讯站

AI妹 5 个月前 15 0

字節跳動宣佈推出全新多模態模型Vidi，專注於視頻理解與編輯，首版核心能力爲精準的時間檢索功能。據AIbase瞭解，Vidi能夠處理視覺、音頻和文本輸入，支持長達一小時的超長視頻分析，在時間檢索任

娱乐与推荐 Gemini1.5Pro 智能视频分析 PyTorch 多模态协同

AI妹 5 个月前 21 0

バイトダンスは、ビデオの理解と編集に特化した新しいマルチモーダルモデル「Vidi」を発表しました。最初の主要機能は、正確な時間検索機能です。AIbaseの情報によると、Vidiは視覚、音声、テキス

视频推荐系统内容创作 PHD-CSWA机制 ActivityNet WebVid-10M

AI妹 5 个月前 17 0

字节跳动宣布推出全新多模态模型Vidi，专注于视频理解与编辑，首版核心能力为精准的时间检索功能。据AIbase了解，Vidi能够处理视觉、音频和文本输入，支持长达一小时的超长视频分析，在时间检索任

时间检索短视频推荐分层注意力机制超长视频支持跨模态语义理解

AI妹 5 个月前 17 0

ByteDance has announced the launch of its new multi-modal model, Vidi, focusing on video understan

multi-modal collaboration ByteScale entertainment and recommendation GitHub VeOmni framework

包含标签"Vidi"的内容