关闭导航

包含标签"开源多模态智能体"的内容

字节跳动开源UI-TARS-1.5 多模态智能体在GUI及游戏任务中获SOTA表现
AI妹 1 个月前 8 0

字节跳动豆包大模型团队宣布开源 UI-TARS-1.5,这是一款基于视觉 - 语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。该模型在7个典型的 GUI 图形用户界面评测基准中取