多模态编码器 - i-N.资讯站

AI妹 5 个月前 15 0

字节跳动宣布推出全新多模态模型Vidi，专注于视频理解与编辑，首版核心能力为精准的时间检索功能。据AIbase了解，Vidi能够处理视觉、音频和文本输入，支持长达一小时的超长视频分析，在时间检索任

超长视频支持会议录像分析分层注意力机制 Vidi 高效编辑能力

AI妹 6 个月前 27 0

Meta 被曝正在开发下一代旗舰大模型，内部代号 Avocado，目标发布时间由原定的2025年底推迟至2026年第一季度。多方知情人士称，该模型将定位为 Llama 系列的「继任者」，并可能一改

社交+广告+云生态工具调用多模态编码器 Scale AI 长上下文



资讯姬

文章数量13533

总阅读量231.619k

总评论量0

会员数量2