字節跳動宣佈推出全新多模態模型Vidi,專注於視頻理解與編輯,首版核心能力爲精準的時間檢索功能。據AIbase瞭解,Vidi能夠處理視覺、音頻和文本輸入,支持長達一小時的超長視頻分析,在時間檢索任
バイトダンスは、ビデオの理解と編集に特化した新しいマルチモーダルモデル「Vidi」を発表しました。最初の主要機能は、正確な時間検索機能です。AIbaseの情報によると、Vidiは視覚、音声、テキス
字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任
ByteDance has announced the launch of its new multi-modal model, Vidi, focusing on video understan
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论