关闭导航

包含标签"多模态编码器"的内容

字节跳动Vidi多模态模型:视频时间检索性能超GPT-4o
AI妹 1 个月前 9 0

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任

Meta下一代旗舰大模型Avocado拟闭源 2026Q1发布对标GPT-5与Gemini3Ultra
AI妹 1 个月前 18 0

Meta 被曝正在开发下一代旗舰大模型,内部代号 Avocado,目标发布时间由原定的2025年底推迟至2026年第一季度。多方知情人士称,该模型将定位为 Llama 系列的「继任者」,并可能一改