音频生成技术正迎来从级联架构向端到端生成的范式转移。针对传统 TTS 系统因“梅尔频谱”中间表征带来的信息损耗与误差累积,美团 LongCat 团队于今日正式发布并开源了 LongCa
テンセント混元チームは、最新開発のInstantCharacterフレームワークの正式オープンソース化を発表しました。拡散トランスフォーマー(DiT)に基づくこのキャラクターパーソナライゼーション
Wanxiang "Wan2.1-VACE" has been announced as open-source, marking a major technological revolution