关闭导航

包含标签"视觉生成"的内容

字节跳动开源Liquid多模态模型 统一token空间与单一LLM重塑生成范式
AI妹 1 个月前 9 0

人工智能領域迎來一項重大突破。AIbase從社交媒體獲悉,字節跳動於近日宣佈開源其全新多模態生成模型Liquid,該模型以創新的統一編碼方式和單一大語言模型(LLM)架構,實現了視覺理解與生成任務

Runway Aleph强上下文视频编辑模型:五大核心功能推动创作普惠化
AI妹 1 个月前 10 0

近日,Runway公司重磅推出全新视频编辑模型Aleph,被誉为“视频领域的Kontext模型”,以其强大的上下文编辑能力引发行业轰动。这款模型支持通过自然语言指令对视频进行多样化编辑,从增删内容

Runway Aleph AI视频编辑:核心功能革新与创作民主化加速
AI妹 1 个月前 8 0

最近、Runway社は新しくビデオ編集モデル「Aleph」を発表しました。このモデルは「ビデオ分野のKontextモデル」として称され、強力な文脈編集能力により業界を震撼させています。このモデルは

字节跳动联合港大、华科推出UniTok视觉分词器 赋能多模态与视觉任务
AI妹 1 个月前 8 0

近日,字节跳动联合香港大学和华中科技大学共同推出了全新的视觉分词器 UniTok。这款工具不仅能在视觉生成和理解任务中发挥作用,还在技术上进行了重要创新,解决了传统分词器在细节捕捉与语义理解之间的

字节跳动联合港大华科推出UniTok视觉分词器 多码本量化赋能视觉任务
AI妹 1 个月前 9 0

近日,字節跳動聯合香港大學和華中科技大學共同推出了全新的視覺分詞器 UniTok。這款工具不僅能在視覺生成和理解任務中發揮作用,還在技術上進行了重要創新,解決了傳統分詞器在細節捕捉與語義理解之間的

腾讯混元开源全新统一多模态奖励模型 兼具长链推理与视觉思考能力
AI妹 1 个月前 11 0

近日,腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下,正式推出了全新研究成果 —— 统一多模态奖励模型(Unified Reward-Think),并宣布全面开源。这一创新模型不仅