关闭导航

包含标签"时间强化Transformer"的内容

字节跳动Vidi多模态模型:长视频时间检索性能超越GPT-4o与Gemini等主流模型
AI妹 1 个月前 11 0

バイトダンスは、ビデオの理解と編集に特化した新しいマルチモーダルモデル「Vidi」を発表しました。最初の主要機能は、正確な時間検索機能です。AIbaseの情報によると、Vidiは視覚、音声、テキス