关闭导航

包含标签"多模态输入处理"的内容

上海AI研究所発表Shusheng・Wanxiang3.0、多模态大模型技術応用進化
AI妹 1 个月前 10 0

人工知能(AI)の急速な進歩の時代において、上海AI研究所は新たな基準を打ち立て、新しいマルチモーダル大規模モデル「Shusheng・Wanxiang 3.0」を発表しました。このアップデート版は

字节跳动Vidi多模态模型:视频时间检索性能超GPT-4o
AI妹 1 个月前 9 0

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任