据报道, 阿里通义实验室 的 Qwen Pilot 团队推出了一项名为 FIPO 的全新算法。该算法旨在打破传统强化学习(RL)在处理复杂逻辑时的瓶颈,让模型在推
阿里通义实验室的 Qwen Pilot 团队近日推出了一种全新的算法 FIPO(Future-KL Influenced Policy Optimization),该算法旨在突破当前大模型在推理过
阿里通义实验室于3月16日正式发布并开源了影视级多场景配音多模态大模型 Fun-CineForge。该模型旨在解决 AI 配音中长期存在的口型不同步、情感表达缺失以及多角色音色不一致等核心痛点,并
在 AIGC 横扫图像与文字领域后,影视行业的最后一个“人工堡垒”——配音,正在被阿里通义实验室攻破。3月16日, 通义实验室 正式发布并开源了全球首个支持影视级
据报道,继阿里通义实验室大模型技术负责人林俊旸离职后,原Qwen(千问)大模型后训练负责人郁博文近日被曝已正式加入字节跳动,出任Seed团队视觉模型与多模态交互团队后训练负责人。尽管字节跳动方面尚
阿里通义实验室宣布,正式推出其最新一代大语言模型 Qwen3.5的系列小尺寸版本。本次发布的模型涵盖了0.8B、2B、4B 以及9B 四种参数规模,旨在通过极致的性能优化,降低 AI 技术的应用门
阿里通义实验室语音团队今日宣布推出两款革命性的语音生成模型:Fun-CosyVoice3.5 与 Fun-AudioGen-VD。这两款模型最大的亮点在于支持“FreeStyle”指令,用户无需复
当图文、视频、图表甚至UI界面都能被统一“理解”并精准匹配,多模态信息检索的边界正在被彻底重构。今日,阿里通义实验室正式开源Qwen3-VL-Embedding与Qwen3-VL-Reranker
阿里通义实验室近日发布了一款名为 “OmniTalker” 的新型数字人视频生成大模型。这一创新模型的核心在于其能够通过上传一段参考视频,实现对视频中人物的表情、声音和说话风格的精准模仿。相较于传
阿里巴巴旗下的通義實驗室在Hugging Face和GitHub平臺正式開源了其最新的Wan2.1-FLF2V-14B首尾幀生視頻模型。這一模型以其支持高清視頻生成和靈活的首尾幀控制功能引發業界熱