Fish Audio 正式发布新一代文本转语音(TTS)模型 S2,标志着开源TTS技术在表现力和可控性上迎来重大突破。 这款名为 Fish Audio S2的模型主打超强情感可控性,用户可通过
阿里通义千问团队昨晚正式开源了 Qwen3-TTS 系列语音生成模型家族,这一重磅更新迅速席卷开源社区,被视为语音合成领域的重大突破。该系列采用端到端架构,支持秒级音色克隆、自然语言音色设计以及实
FASHN AI正式发布了其最新虚拟试穿模型FASHN v1.5,标志着虚拟试穿技术在速度、精准度和用户体验上的重大进步。 技术革新:无分割处理与速度提升 FASHN v1.5引入了革命性的无
FASHN AI正式發佈了其最新虛擬試穿模型FASHN v1.5,標誌着虛擬試穿技術在速度、精準度和用戶體驗上的重大進步。 技術革新:無分割處理與速度提升 FASHN v1.5引入了革命性的無
NVIDIA AI研究团队发布了一项突破性技术——Audio-SDS,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,显著提升了音效生成、音源分离
谷歌雲平臺(GCP)Vertex AI的配額下拉菜單中新增了Imagen4和Imagen4Fast選項,預示着這兩款下一代AI圖像生成模型即將迎來更廣泛的推廣。繼Imagen3的成功後,Image
xAI宣布推出Live Search API,一款支持实时动态搜索X平台、互联网、热门新闻和RSS订阅源的强大工具,目前进入免费Beta测试阶段,开放至2025年6月5日。凭借无需手动管理搜索逻辑
At a critical moment when artificial intelligence and blockchain technology are accelerating their
谷歌DeepMind近日宣布开源全新Python库“GenAI Processors”,为开发者提供了一个轻量级、高效的工具,用于构建异步、可组合的生成式AI工作流。这一开源库旨在简化复杂多模态A