关闭导航

包含标签"文本到图像生成"的内容

昆仑万维开源Skywork UniPic多模态模型 融合生成理解编辑核心能力
AI妹 1 个月前 9 0

7月30日,崑崙萬維正式推出並開源了採用自迴歸路線的多模態統一預訓練模型Skywork UniPic。該模型在單一架構中深度融合了圖像理解、文本到圖像生成及圖像編輯三大核心能力,基於大規模高質量數

昆仑万维开源Skywork UniPic多模态模型 融合三大能力且应用门槛低
AI妹 1 个月前 7 0

7月30日,昆仑万维正式推出并开源了采用自回归路线的多模态统一预训练模型Skywork UniPic。该模型在单一架构中深度融合了图像理解、文本到图像生成及图像编辑三大核心能力,基于大规模高质量数

昆仑万维发布全新开源多模态统一预训练模型Skywork UniPic
AI妹 1 个月前 8 0

近日,昆仑万维正式发布了其全新且开源的多模态统一预训练模型 ——Skywork UniPic。该模型以其强大的功能和高效的性能引发了业界的广泛关注。 Skywork UniPic 采用自回归的训

昆仑万维正式发布全新开源多模态统一预训练模型Skywork UniPic
AI妹 1 个月前 9 0

近日,崑崙萬維正式發佈了其全新且開源的多模態統一預訓練模型 ——Skywork UniPic。該模型以其強大的功能和高效的性能引發了業界的廣泛關注。 Skywork UniPic 採用自迴歸的訓

腾讯X-Omni多模态AI模型:图像生成理解突破,长文本渲染精准高效领先
AI妹 1 个月前 7 0

Tencent research team has released a new multimodal AI model, X-Omni, which has achieved significa

Flow-GRPO:突破图像生成模型瓶颈,显著提升生成效果与人类偏好对齐
AI妹 1 个月前 10 0

家人們,今天必須給你們嘮嘮科研界的一項超酷新成果 ——Flow-GRPO!這東西可不得了,它就像是給圖像生成模型打了一針 “超級進化劑”,直接讓它們從 “青銅” 一路飆升到 “王者”。想知道它是怎

Salesforce BLIP3-o全开源多模态模型Hugging Face发布 技术突破引行业热议
AI妹 1 个月前 7 0

Salesforce AI Research在Hugging Face平臺正式發佈BLIP3-o應用,這款全開源的統一多模態模型家族以其卓越的圖像理解與生成能力引發業界熱議。BLIP3-o通過創新

Salesforce BLIP3-o全开源统一多模态模型Hugging Face发布引业界热议
AI妹 1 个月前 7 0

Salesforce AI Research在Hugging Face平台正式发布BLIP3-o应用,这款全开源的统一多模态模型家族以其卓越的图像理解与生成能力引发业界热议。BLIP3-o通过创新

Salesforce BLIP3-o全开源统一多模态模型于Hugging Face平台正式发布
AI妹 1 个月前 8 0

Salesforce AI Research has officially released BLIP3-o on the Hugging Face platform, a fully open-

字节跳动开源多模态模型BAGEL:70亿参数 性能卓越覆盖生成编辑
AI妹 1 个月前 10 0

字節跳動 發佈了一款名爲 BAGEL 的開源多模態基礎模型,擁有70億個活躍參數,整體參數量達到140億。 BAGEL 在標準多模態理解基準測試中表現出色,超越了當前一些頂級開源視覺語言模型

    1 2