关闭导航

包含标签"扩散Transformer(DiT)"的内容

美团LongCat团队开源LongCat-AudioDiT 端到端语音克隆性能创新高
AI妹 14 天前 1 0

 音频生成技术正迎来从级联架构向端到端生成的范式转移。针对传统 TTS 系统因“梅尔频谱”中间表征带来的信息损耗与误差累积,美团 LongCat 团队于今日正式发布并开源了 LongCa

腾讯混元正式开源基于DiT的InstantCharacter框架 引领AI角色定制技术新变革
AI妹 3 个月前 15 0

テンセント混元チームは、最新開発のInstantCharacterフレームワークの正式オープンソース化を発表しました。拡散トランスフォーマー(DiT)に基づくこのキャラクターパーソナライゼーション

万像Wan2.1-VACE开源 引领AI视频编辑一站式多模态可控创作技术革命
AI妹 3 个月前 11 0

Wanxiang "Wan2.1-VACE" has been announced as open-source, marking a major technological revolution