关闭导航

包含标签"阿里巴巴通义实验室"的内容

阿里巴巴通义实验室MAI-UI:多模态GUI智能代理 基准测试性能领先同行
AI妹 20 天前 7 0

阿里巴巴通义实验室近日发布了 MAI-UI,这是一个多模态的基础 GUI 智能代理家族。该系统不仅能够实现人机交互,还能整合 MCP 工具使用、设备与云端协作,以及在线强化学习,从而在通用 GUI

阿里通义实验室开源新一代Fun-Audio-Chat-8B端到端低延迟情感语音交互大模型
AI妹 26 天前 12 0

阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B,这款模型以超低延迟、自然流畅的语音交互为核心,标志着开源语音AI进入全新阶段。它不仅能实时理解用户语音,还具

阿里通义实验室P10薄列峰离职 驻美不受竞业限制加盟头部互联网公司
AI妹 1 个月前 9 0

据多方信源透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级P10)已于2024年4月30日正式离职,并低调加盟某头部互联网公司,出任新设立的多模态模型部副总经理一职。 尽管该互联网公司具体

阿里通义实验室P10薄列峯离职 驻美无竞业限制加盟头部公司多模态部
AI妹 1 个月前 10 0

據多方信源透露,阿里巴巴通義實驗室應用視覺團隊負責人薄列峯(職級P10)已於2024年4月30日正式離職,並低調加盟某頭部互聯網公司,出任新設立的多模態模型部副總經理一職。 儘管該互聯網公司具體

阿里云通义实验室开源WebAgent 核心组件助力自主搜索智能体领先开源领域
AI妹 1 个月前 10 0

阿里雲通義實驗室近日宣佈正式開源其自主搜索AI智能體項目 WebAgent,其中旗艦組件 WebShaper 和 WebSailor 在網絡智能體領域引發廣泛關注。作爲一款突破性的AI工具,Web

阿里南开联合研发LLaVA-Scissor 高效压缩视频大模型token提升处理效率
AI妹 1 个月前 8 0

近日,阿里巴巴通义实验室与南开大学计算机科学学院联合发布了一种创新的视频大模型压缩方法 ——LLaVA-Scissor。这一技术的出现旨在应对视频模型处理中的一系列挑战,特别是传统方法在处理视频帧

阿里南開聯合研發LLaVA-Scissor 高效壓縮視頻大模型token並提升性能
AI妹 1 个月前 8 0

近日,阿里巴巴通義實驗室與南開大學計算機科學學院聯合發佈了一種創新的視頻大模型壓縮方法 ——LLaVA-Scissor。這一技術的出現旨在應對視頻模型處理中的一系列挑戰,特別是傳統方法在處理視頻幀

阿里通义实验室核心ZeroSearch框架 让大模型无需真实搜索有效增强推理能力
AI妹 1 个月前 6 0

In the rapid development of artificial intelligence, how to enhance the retrieval and reasoning ca

阿里巴巴通义实验室开源ThinkSound 多模态音频模型赋能音效创作新革命
AI妹 1 个月前 10 0

2025年7月,阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound,为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入,生成高保真的音效与音景,完美适配画面

阿里巴巴通义实验室开源ThinkSound 多模态音频生成开启音效新革命
AI妹 1 个月前 10 0

2025年7月,阿里巴巴通義實驗室正式開源其首款音頻生成模型ThinkSound,爲視頻內容創作帶來革命性突破。這款多模態AI模型能夠基於視頻、文本或音頻輸入,生成高保真的音效與音景,完美適配畫面

    1 2