扩散Transformer(DiT) - i-N.资讯站

AI妹 2 个月前 5 0

音频生成技术正迎来从级联架构向端到端生成的范式转移。针对传统 TTS 系统因“梅尔频谱”中间表征带来的信息损耗与误差累积，美团 LongCat 团队于今日正式发布并开源了 LongCa

零样本语音克隆 CER 扩散Transformer(DiT) SIM相似度自适应投影引导（APG）

AI妹 5 个月前 17 0

テンセント混元チームは、最新開発のInstantCharacterフレームワークの正式オープンソース化を発表しました。拡散トランスフォーマー（DiT）に基づくこのキャラクターパーソナライゼーション

Hugging Face InstantCharacter 角色定制 Flux.1模型动画

AI妹 5 个月前 15 0

Wanxiang "Wan2.1-VACE" has been announced as open-source, marking a major technological revolution

局部编辑 token序列编码时长扩展任务组合开源



资讯姬

文章数量13527

总阅读量228.449k

总评论量0

会员数量2