关闭导航

包含标签"DiT"的内容

昆仑万维发布SkyReels-A3 音频驱动数字人创作开启高效声影新可能
AI妹 1 个月前 10 0

崑崙萬維集團宣佈推出其最新技術成果SkyReels-A3模型,這是一款基於DiT(Diffusion Transformer)視頻擴散模型的音頻驅動數字人創作工具。SkyReels-A3的發佈標誌

Direct3D-S2:空间稀疏注意力引领高分辨率3D生成效率与质量双突破
AI妹 1 个月前 9 0

近日,一款名为 Direct3D-S2的全新3D 生成框架引发了业界热议。该框架通过创新的 空间稀疏注意力(SSA)机制,显著提升了高分辨率3D 图像生成的质量与效率,为千兆级3D 生成提供了更具

Direct3D-S2框架:空间稀疏注意力驱动高效高分辨率3D生成
AI妹 1 个月前 8 0

近日,一款名爲 Direct3D-S2的全新3D 生成框架引發了業界熱議。該框架通過創新的 空間稀疏注意力(SSA)機制,顯著提升了高分辨率3D 圖像生成的質量與效率,爲千兆級3D 生成提供了更具

字节跳动Seed团队推出GR-3 VLA模型,机器人操作能力获突破性进展
AI妹 1 个月前 9 0

近日,字节跳动Seed团队正式推出全新Vision-Language-Action Model(VLA)模型GR-3,该模型在机器人操作领域展现出突破性能力,不仅能理解包含抽象概念的语言指令,还可

字节跳动Seed团队推出GR-3 VLA模型 机器人操作能力实现突破性进展
AI妹 1 个月前 10 0

近日,字節跳動Seed團隊正式推出全新Vision-Language-Action Model(VLA)模型GR-3,該模型在機器人操作領域展現出突破性能力,不僅能理解包含抽象概念的語言指令,還可

阿里北邮联合推出FantasyPortrait 数字人表情迁移多角色控制获突破
AI妹 1 个月前 9 0

人工智能在數字人領域的應用持續升溫,阿里巴巴聯合北京郵電大學近日推出了一項令人矚目的新項目——FantasyPortrait。這一項目通過創新的表情增強擴散變換器(DiT),實現了單人及多人場景下

阿里北邮FantasyPortrait 数字人动画技术获新突破
AI妹 1 个月前 9 0

人工知能はデジタル人間分野での応用がますます熱を帯びており、アリババは北京郵電大学と協力して近日、注目を集める新プロジェクト「FantasyPortrait」を発表しました。このプロジェクトは、イ

阿里北邮联合发布FantasyPortrait 数字人动画技术实现多项突破
AI妹 1 个月前 8 0

人工智能在数字人领域的应用持续升温,阿里巴巴联合北京邮电大学近日推出了一项令人瞩目的新项目——FantasyPortrait。这一项目通过创新的表情增强扩散变换器(DiT),实现了单人及多人场景下

vLLM发布全模态推理框架vLLM-Omni 解耦架构提效开源
AI妹 1 个月前 20 0

vLLM团队发布首个“全模态”推理框架vLLM-Omni,将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs,开发者可立即pip安装并调用

    1 2