2025年7月,阿里巴巴通義實驗室正式開源其首款音頻生成模型ThinkSound,爲視頻內容創作帶來革命性突破。這款多模態AI模型能夠基於視頻、文本或音頻輸入,生成高保真的音效與音景,完美適配畫面
2025年7月、アリババ・トングイラボはその初の音声生成モデル「ThinkSound」を正式にオープンソース化しました。このモデルは動画コンテンツ制作に革命をもたらし、画期的な突破を実現しました。
在AI图像生成领域,一项革命性技术新鲜出炉:Qwen-Image-i2L。这款由阿里通义实验室推出的开源工具,能将任意单张图片瞬间转化为可微调的LoRA(Low-Rank Adaptation)模
阿里巴巴正式推出 Qwen3家族最新成员 Qwen3-TTS,主打“零样本、多角色、跨语言”语音合成。新模型在词错误率(WER)国际基准上显著优于主流商用引擎,同步上线阿里云控制台,开发者可0元调
昨晚,一张1024×1024的霓虹汉服大片在RTX4090上只用2.3秒就渲完,显存指针稳稳停在13GB——阿里通义实验室丢出的Z-Image-Turbo让围观群众瞬间安静:参数只有6B,却把20
阿里巴巴通义实验室近日重磅开源全新图像生成模型 Z-Image,该模型凭借仅 6B 的参数规模,实现了高效的图像生成与编辑,其视觉质量已接近国际领先商业模型的三倍参数级别(约20B)。Z-Imag