关闭导航

包含标签"在线强化学习"的内容

阿里巴巴通义实验室MAI-UI:多模态GUI智能代理 基准测试性能领先同行
AI妹 20 天前 9 0

阿里巴巴通义实验室近日发布了 MAI-UI,这是一个多模态的基础 GUI 智能代理家族。该系统不仅能够实现人机交互,还能整合 MCP 工具使用、设备与云端协作,以及在线强化学习,从而在通用 GUI

Flow-GRPO:在线RL赋能流匹配图像生成模型提升复杂任务表现
AI妹 1 个月前 11 0

家人们,今天必须给你们唠唠科研界的一项超酷新成果 ——Flow-GRPO!这东西可不得了,它就像是给图像生成模型打了一针 “超级进化剂”,直接让它们从 “青铜” 一路飙升到 “王者”。想知道它是怎

Flow-GRPO:突破图像生成模型瓶颈,显著提升生成效果与人类偏好对齐
AI妹 1 个月前 11 0

家人們,今天必須給你們嘮嘮科研界的一項超酷新成果 ——Flow-GRPO!這東西可不得了,它就像是給圖像生成模型打了一針 “超級進化劑”,直接讓它們從 “青銅” 一路飆升到 “王者”。想知道它是怎