关闭导航

包含标签"视频输入"的内容

字节跳动Seedance2.0全球推出 盲测第一引领多模态AI视频生成赋能新创作者
AI妹 23 天前 2 0

字节跳动(ByteDance)旗下前沿 AI 视频生成模型 Seedance2.0已正式在全球范围内推出。这一最新版本集成多模态统一架构,支持文本、图像、音频及视频多输入方式,可生成最高1080p

艾伦人工智能研究所发布Molmo2开源视频语言模型支持多模态推理与定制
AI妹 3 个月前 21 0

近日,艾伦人工智能研究所(Ai2)发布了全新的 Molmo2开源视频语言模型。这一系列新模型和相关训练数据展示了该非营利机构在开源领域的坚定承诺,特别是在企业希望掌控模型使用的背景下,这无疑是一项

南洋理工与上海AI实验室联合发布PhysX-Anything开源框架 单RGB图生成物理3D资产
AI妹 4 个月前 24 0

南洋理工大学与上海人工智能实验室联合发布开源框架 PhysX-Anything,只需一张 RGB 图像即可输出带几何、关节、物理参数的完整3D 资产,可直接导入 MuJoCo、Isaac Sim