关闭导航

包含标签"结构化理解画面"的内容

阿里语音AI团队开源ThinkSound 全球首个支持链式推理的音频生成模型
AI妹 1 个月前 8 0

近日,阿里語音AI團隊宣佈開源全球首個支持鏈式推理的音頻生成模型ThinkSound,該模型通過引入思維鏈(Chain-of-Thought)技術,突破傳統視頻轉音頻技術對畫面動態捕捉的侷限,實現