视觉生成 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"视觉生成"的内容

美团推出2026 LongCat大模型北斗实习计划招募AGI领域顶尖实习生

美团推出2026 LongCat大模型北斗实习计划招募AGI领域顶尖实习生

AI妹 2 个月前 5 0

美团近日正式推出2026年“LongCat大模型北斗实习计划”，面向全球高校全日制在读硕士及博士，招募大模型领域顶尖实习生。该计划依托美团基础大模型团队LongCat，聚焦通用人工智能（AGI）研

通用人工智能(AGI) 美团 Infra架构开源模型矩阵大模型领域

查看详情

字节跳动开源Liquid多模态模型统一token空间与单一LLM重塑生成范式

字节跳动开源Liquid多模态模型统一token空间与单一LLM重塑生成范式

AI妹 5 个月前 19 0

人工智能領域迎來一項重大突破。AIbase從社交媒體獲悉，字節跳動於近日宣佈開源其全新多模態生成模型Liquid，該模型以創新的統一編碼方式和單一大語言模型（LLM）架構，實現了視覺理解與生成任務

MJHQ-30K VQVAE 统一token空间 FID VQAscore

查看详情

Runway Aleph强上下文视频编辑模型：五大核心功能推动创作普惠化

Runway Aleph强上下文视频编辑模型：五大核心功能推动创作普惠化

AI妹 5 个月前 24 0

近日，Runway公司重磅推出全新视频编辑模型Aleph，被誉为“视频领域的Kontext模型”，以其强大的上下文编辑能力引发行业轰动。这款模型支持通过自然语言指令对视频进行多样化编辑，从增删内容

上下文理解电影制作广告营销视频编辑模型绿幕抠像

查看详情

Runway Aleph AI视频编辑：核心功能革新与创作民主化加速

Runway Aleph AI视频编辑：核心功能革新与创作民主化加速

AI妹 5 个月前 16 0

最近、Runway社は新しくビデオ編集モデル「Aleph」を発表しました。このモデルは「ビデオ分野のKontextモデル」として称され、強力な文脈編集能力により業界を震撼させています。このモデルは

自然语言指令上下文理解视觉生成视频编辑模型上下文编辑能力

查看详情

字节跳动联合港大、华科推出UniTok视觉分词器赋能多模态与视觉任务

字节跳动联合港大、华科推出UniTok视觉分词器赋能多模态与视觉任务

AI妹 5 个月前 14 0

近日，字节跳动联合香港大学和华中科技大学共同推出了全新的视觉分词器 UniTok。这款工具不仅能在视觉生成和理解任务中发挥作用，还在技术上进行了重要创新，解决了传统分词器在细节捕捉与语义理解之间的

统一视觉表示创意设计高质量图像重建多码本量化技术 UniTok

查看详情

字节跳动联合港大华科推出UniTok视觉分词器多码本量化赋能视觉任务

字节跳动联合港大华科推出UniTok视觉分词器多码本量化赋能视觉任务

AI妹 5 个月前 15 0

近日，字節跳動聯合香港大學和華中科技大學共同推出了全新的視覺分詞器 UniTok。這款工具不僅能在視覺生成和理解任務中發揮作用，還在技術上進行了重要創新，解決了傳統分詞器在細節捕捉與語義理解之間的

华中科技大学教育创意设计香港大学视觉分词器

查看详情

腾讯混元开源全新统一多模态奖励模型兼具长链推理与视觉思考能力

腾讯混元开源全新统一多模态奖励模型兼具长链推理与视觉思考能力

AI妹 5 个月前 22 0

近日，腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下，正式推出了全新研究成果 —— 统一多模态奖励模型（Unified Reward-Think），并宣布全面开源。这一创新模型不仅

视觉理解多模态AI研究视觉任务思考能力开放态度数据集

查看详情



资讯姬

文章数量13530

总阅读量231.619k

总评论量0

会员数量2

本站由emlog驱动