关闭导航

包含标签"多模态大语言模型(MLLM)"的内容

字节跳动联合港大华科推出UniTok视觉分词器 多码本量化赋能视觉任务
AI妹 1 个月前 9 0

近日,字節跳動聯合香港大學和華中科技大學共同推出了全新的視覺分詞器 UniTok。這款工具不僅能在視覺生成和理解任務中發揮作用,還在技術上進行了重要創新,解決了傳統分詞器在細節捕捉與語義理解之間的