音频生成模型 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"音频生成模型"的内容

阿里语音AI开源ThinkSound 全球首个支持链式推理的音频生成模型

阿里语音AI开源ThinkSound 全球首个支持链式推理的音频生成模型

AI妹 5 个月前 16 0

近日，阿里语音AI团队宣布开源全球首个支持链式推理的音频生成模型ThinkSound，该模型通过引入思维链（Chain-of-Thought）技术，突破传统视频转音频技术对画面动态捕捉的局限，实现

链式推理 GitHub 空间音频生成 VGGSound 游戏开发

查看详情

阿里语音AI团队开源ThinkSound 全球首个支持链式推理的音频生成模型

阿里语音AI团队开源ThinkSound 全球首个支持链式推理的音频生成模型

AI妹 5 个月前 16 0

近日，阿里語音AI團隊宣佈開源全球首個支持鏈式推理的音頻生成模型ThinkSound，該模型通過引入思維鏈（Chain-of-Thought）技術，突破傳統視頻轉音頻技術對畫面動態捕捉的侷限，實現

游戏开发 GitHub 链式推理空间音频生成虚拟现实

查看详情

阿里巴巴通义实验室开源ThinkSound 多模态音频模型赋能音效创作新革命

阿里巴巴通义实验室开源ThinkSound 多模态音频模型赋能音效创作新革命

AI妹 5 个月前 18 0

2025年7月，阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound，为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入，生成高保真的音效与音景，完美适配画面

Qwen语言模型 Wan2.1视频生成模型多模态融合 ModelScope 高精度同步

查看详情

阿里巴巴通义实验室开源ThinkSound 多模态音频生成开启音效新革命

阿里巴巴通义实验室开源ThinkSound 多模态音频生成开启音效新革命

AI妹 5 个月前 15 0

2025年7月，阿里巴巴通義實驗室正式開源其首款音頻生成模型ThinkSound，爲視頻內容創作帶來革命性突破。這款多模態AI模型能夠基於視頻、文本或音頻輸入，生成高保真的音效與音景，完美適配畫面

音画同步 ModelScope Hugging Face Wan2.1视频生成模型阿里巴巴通义实验室

查看详情



资讯姬

文章数量13538

总阅读量234.744k

总评论量0

会员数量2

本站由emlog驱动