在最新发布的 GLM-5.1中,这一开源模型展示了其卓越的智能水平,能够在长达8小时的任务中独立工作,完成复杂的工程项目。与之前仅能进行短时间交互的模型相比,GLM-5.1在代码能力和长程任务执行
阿里通义实验室于3月16日正式发布并开源了影视级多场景配音多模态大模型 Fun-CineForge。该模型旨在解决 AI 配音中长期存在的口型不同步、情感表达缺失以及多角色音色不一致等核心痛点,并
传统的 AI 配音在面对影视、动画等高标准场景时,常因难以匹配复杂的情绪爆发和精准口型而遭遇瓶颈。针对这一痛点,通义实验室正式发布并开源了首个影视级多场景配音多模态大模型——
近日,通义千问(Qwen)团队宣布其开源大模型家族Qwen3.5实现重要扩容,一次发布多款新模型,并同步上线了对应的生产级API服务。 本次新增的开源模型主要包括三款: Qwen3.5-
蚂蚁集团旗下的具身智能公司灵波科技近日宣布,正式开源其具身大模型LingBot-VLA。该模型不仅在多项权威基准测试中表现卓越,更同步开放了完整的后训练代码库,旨在降低具身智能领域的研发门槛。
今日,美团 LongCat 团队正式发布并开源了最新的 AI 模型 ——LongCat-Flash-Thinking-2601。该模型作为 LongCat-Flash-Thinking 系列的升级
近日,MiniMax 正式宣布开源其全新 M2.1编程模型,标志着其在人工智能领域的重要进展。这一模型现已同步上线于 Hugging Face、ModelScope 以及 GitHub 等多个平台
阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B,这款模型以超低延迟、自然流畅的语音交互为核心,标志着开源语音AI进入全新阶段。它不仅能实时理解用户语音,还具
今日,通义千问团队正式发布全新图像生成模型 Qwen-Image-Layered,该模型以自研创新架构打破传统 AI 图片编辑局限,通过 “图层拆解” 技术赋予静态图片可编辑性,开启 “指哪改哪”
长期以来,将一张普通的扁平化照片转换为可灵活编辑的图层文件,一直是专业设计师的“刚需”。据 AIbase 报道,阿里巴巴旗下人工智能部门 Qwen 近日推出了一款革命性的图像编辑模型 —— Qwe