当图文、视频、图表甚至UI界面都能被统一“理解”并精准匹配,多模态信息检索的边界正在被彻底重构。今日,阿里通义实验室正式开源Qwen3-VL-Embedding与Qwen3-VL-Reranker
阿里通义实验室近日发布了一款名为 “OmniTalker” 的新型数字人视频生成大模型。这一创新模型的核心在于其能够通过上传一段参考视频,实现对视频中人物的表情、声音和说话风格的精准模仿。相较于传
阿里巴巴旗下的通義實驗室在Hugging Face和GitHub平臺正式開源了其最新的Wan2.1-FLF2V-14B首尾幀生視頻模型。這一模型以其支持高清視頻生成和靈活的首尾幀控制功能引發業界熱
阿里巴巴旗下的通义实验室在Hugging Face和GitHub平台正式开源了其最新的Wan2.1-FLF2V-14B首尾帧生视频模型。这一模型以其支持高清视频生成和灵活的首尾帧控制功能引发业界热
阿里通義實驗室(Tongyi Lab)近日重磅推出WebAgent系列的第四款開源工具——WebShaper,這一突破性框架以其創新的“形式化驅動”信息檢索範式引發行業熱議。據AIbase從社交媒
阿里通义实验室(Tongyi Lab)近日重磅推出WebAgent系列的第四款开源工具——WebShaper,这一突破性框架以其创新的“形式化驱动”信息检索范式引发行业热议。据AIbase从社交媒
在人工智能的迅速發展中,如何提升大語言模型(LLM)的檢索和推理能力成爲研究的熱門話題。近日,阿里通義實驗室提出了一個名爲 “ZeroSearch” 的新框架,它能夠使大型語言模型自己模擬搜索引擎
在人工智能的迅速发展中,如何提升大语言模型(LLM)的检索和推理能力成为研究的热门话题。近日,阿里通义实验室提出了一个名为 “ZeroSearch” 的新框架,它能够使大型语言模型自己模拟搜索引擎
在AI图像生成领域,一项革命性技术新鲜出炉:Qwen-Image-i2L。这款由阿里通义实验室推出的开源工具,能将任意单张图片瞬间转化为可微调的LoRA(Low-Rank Adaptation)模
昨晚,一张1024×1024的霓虹汉服大片在RTX4090上只用2.3秒就渲完,显存指针稳稳停在13GB——阿里通义实验室丢出的Z-Image-Turbo让围观群众瞬间安静:参数只有6B,却把20
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论