关闭导航

包含标签"GitHub"的内容

阿里巴巴HumanOmniV2多模态模型:强语境理解重塑AI应用边界
AI妹 1 个月前 8 0

アリババグループは最近、最新のマルチモーダル大規模言語モデルHumanOmniV2を正式にリリースし、AI分野で再び注目を集めています。このモデルは、強力な全体的な文脈理解能力とマルチモーダル推論

阿里语音AI开源ThinkSound 全球首个支持链式推理的音频生成模型
AI妹 1 个月前 8 0

近日,阿里语音AI团队宣布开源全球首个支持链式推理的音频生成模型ThinkSound,该模型通过引入思维链(Chain-of-Thought)技术,突破传统视频转音频技术对画面动态捕捉的局限,实现

阿里语音AI团队开源ThinkSound 全球首个支持链式推理的音频生成模型
AI妹 1 个月前 9 0

近日,阿里語音AI團隊宣佈開源全球首個支持鏈式推理的音頻生成模型ThinkSound,該模型通過引入思維鏈(Chain-of-Thought)技術,突破傳統視頻轉音頻技術對畫面動態捕捉的侷限,實現

阿里巴巴通义开源WebSailor 助推AI Agent经济 相关企业布局受关注
AI妹 1 个月前 10 0

Alibaba Tongyi has officially open-sourced its network agent WebSailor, which possesses strong rea

阿里巴巴通义实验室开源ThinkSound 多模态音频模型赋能音效创作新革命
AI妹 1 个月前 11 0

2025年7月,阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound,为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入,生成高保真的音效与音景,完美适配画面

阿里通义实验室开源ThinkSound 多模态AI音频生成赋能影视游戏等创作领域
AI妹 1 个月前 10 0

In July 2025, Alibaba's Tongyi Lab officially open-sourced its first audio generation model, Think

阿里巴巴通义实验室开源ThinkSound 多模态音频生成开启音效新革命
AI妹 1 个月前 11 0

2025年7月,阿里巴巴通義實驗室正式開源其首款音頻生成模型ThinkSound,爲視頻內容創作帶來革命性突破。這款多模態AI模型能夠基於視頻、文本或音頻輸入,生成高保真的音效與音景,完美適配畫面

阿里通义ThinkSound 2025开源 AI音声生成革新行业新方向
AI妹 1 个月前 7 0

2025年7月、アリババ・トングイラボはその初の音声生成モデル「ThinkSound」を正式にオープンソース化しました。このモデルは動画コンテンツ制作に革命をもたらし、画期的な突破を実現しました。