关闭导航

包含标签"Diffusion Transformer(DiT)"的内容

腾讯混元正式发布并开源HY-Motion1.0文生3D动作大模型
AI妹 12 天前 7 0

近日,腾讯混元正式发布并开源其全新文生3D 动作大模型 ——HY-Motion1.0。这一模型以其十亿参数量级和基于 Diffusion Transformer (DiT) 的架构,标志着3D 角

腾讯混元开源HY-Motion1.0 十亿参数文本到3D动作生成大模型
AI妹 20 天前 10 0

2025年12月30日,腾讯混元团队重磅开源HY-Motion1.0(Hunyuan-Motion-1.0),一款十亿参数级文本到3D动作生成大模型。该模型基于Diffusion Transfor

腾讯开源InstantCharacter框架 AI驱动单图文本生成高一致性定制角色
AI妹 1 个月前 9 0

この度、テンセントがInstantCharacterフレームワークを正式にオープンソース化し、AI駆動型キャラクターカスタマイズ分野に画期的な進歩をもたらしました。AIbaseの調査によると、この

WORLDMEM框架Hugging Face开源 突破长期一致性世界模拟技术难题
AI妹 1 个月前 9 0

近日,WORLDMEM框架正式在Hugging Face平臺開源發佈,標誌着長期一致性世界模擬技術的重要突破。據AIbase瞭解,WORLDMEM通過引入記憶機制,解決了傳統世界模擬模型在長期一致

WORLDMEM框架Hugging Face开源 记忆驱动世界模拟新突破
AI妹 1 个月前 9 0

この度、WORLDMEMフレームワークがHugging Faceプラットフォームで正式にオープンソースとして公開されました。これは、長期的整合性を持つ世界シミュレーション技術における重要なブレーク

WORLDMEM开源框架:记忆机制突破长期一致性,赋能多领域应用
AI妹 1 个月前 9 0

近日,WORLDMEM框架正式在Hugging Face平台开源发布,标志着长期一致性世界模拟技术的重要突破。据AIbase了解,WORLDMEM通过引入记忆机制,解决了传统世界模拟模型在长期一致

GR-3 VLAモデル発表、ロボット操作に画期的能力、汎用ロボット脳への進展
AI妹 1 个月前 9 0

最近、ビットテックのSeedチームは新規なVision-Language-Action Model(VLA)モデルGR-3を正式にリリースしました。このモデルはロボット操作分野で画期的な能力を示し