文本到图像生成 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"文本到图像生成"的内容

昆仑万维开源Skywork UniPic多模态模型融合生成理解编辑核心能力

昆仑万维开源Skywork UniPic多模态模型融合生成理解编辑核心能力

AI妹 5 个月前 21 0

7月30日，崑崙萬維正式推出並開源了採用自迴歸路線的多模態統一預訓練模型Skywork UniPic。該模型在單一架構中深度融合了圖像理解、文本到圖像生成及圖像編輯三大核心能力，基於大規模高質量數

MAR编码器文本到图像生成多模态统一预训练模型 SigLIP主干网络自回归路线

查看详情

昆仑万维开源Skywork UniPic多模态模型融合三大能力且应用门槛低

昆仑万维开源Skywork UniPic多模态模型融合三大能力且应用门槛低

AI妹 5 个月前 18 0

7月30日，昆仑万维正式推出并开源了采用自回归路线的多模态统一预训练模型Skywork UniPic。该模型在单一架构中深度融合了图像理解、文本到图像生成及图像编辑三大核心能力，基于大规模高质量数

自回归路线 MAR编码器 Reward Model优化 SigLIP2主干网络复杂指令生图

查看详情

昆仑万维发布全新开源多模态统一预训练模型Skywork UniPic

昆仑万维发布全新开源多模态统一预训练模型Skywork UniPic

AI妹 5 个月前 12 0

近日，昆仑万维正式发布了其全新且开源的多模态统一预训练模型 ——Skywork UniPic。该模型以其强大的功能和高效的性能引发了业界的广泛关注。 Skywork UniPic 采用自回归的训

文本到图像生成通用性企业端到端预训练 AI技术领域

查看详情

昆仑万维正式发布全新开源多模态统一预训练模型Skywork UniPic

昆仑万维正式发布全新开源多模态统一预训练模型Skywork UniPic

AI妹 5 个月前 17 0

近日，崑崙萬維正式發佈了其全新且開源的多模態統一預訓練模型 ——Skywork UniPic。該模型以其強大的功能和高效的性能引發了業界的廣泛關注。 Skywork UniPic 採用自迴歸的訓

Skywork UniPic AI应用普及多模态统一预训练模型可迁移性文本到图像生成

查看详情

腾讯X-Omni多模态AI模型：图像生成理解突破，长文本渲染精准高效领先

腾讯X-Omni多模态AI模型：图像生成理解突破，长文本渲染精准高效领先

AI妹 5 个月前 17 0

Tencent research team has released a new multimodal AI model, X-Omni, which has achieved significa

GOT-OCR2.0 X-Omni 统一建模腾讯多模态AI模型强化学习框架

查看详情

Flow-GRPO：突破图像生成模型瓶颈，显著提升生成效果与人类偏好对齐

Flow-GRPO：突破图像生成模型瓶颈，显著提升生成效果与人类偏好对齐

AI妹 5 个月前 23 0

家人們，今天必須給你們嘮嘮科研界的一項超酷新成果 ——Flow-GRPO!這東西可不得了，它就像是給圖像生成模型打了一針 “超級進化劑”，直接讓它們從 “青銅” 一路飆升到 “王者”。想知道它是怎

Flow-GRPO 随机微分方程 GenEval基准图像生成模型 PickScore奖励模型

查看详情

Salesforce BLIP3-o全开源多模态模型Hugging Face发布技术突破引行业热议

Salesforce BLIP3-o全开源多模态模型Hugging Face发布技术突破引行业热议

AI妹 5 个月前 16 0

Salesforce AI Research在Hugging Face平臺正式發佈BLIP3-o應用，這款全開源的統一多模態模型家族以其卓越的圖像理解與生成能力引發業界熱議。BLIP3-o通過創新

GPT-4o BLIP-2 BLIP3-o xGen-MM（BLIP-3）系列自回归架构

查看详情

Salesforce BLIP3-o全开源统一多模态模型Hugging Face发布引业界热议

Salesforce BLIP3-o全开源统一多模态模型Hugging Face发布引业界热议

AI妹 5 个月前 14 0

Salesforce AI Research在Hugging Face平台正式发布BLIP3-o应用，这款全开源的统一多模态模型家族以其卓越的图像理解与生成能力引发业界热议。BLIP3-o通过创新

Salesforce AI Research 自回归架构 CLIP图像特征 Creative Commons Attribution Non Commercial4.0许可证 Hugging Face

查看详情

Salesforce BLIP3-o全开源统一多模态模型于Hugging Face平台正式发布

Salesforce BLIP3-o全开源统一多模态模型于Hugging Face平台正式发布

AI妹 5 个月前 18 0

Salesforce AI Research has officially released BLIP3-o on the Hugging Face platform, a fully open-

GPT-4o MiniMax Qwen3 CLIP图像特征 Gradio Web demo

查看详情

字节跳动开源多模态模型BAGEL：70亿参数性能卓越覆盖生成编辑

字节跳动开源多模态模型BAGEL：70亿参数性能卓越覆盖生成编辑

AI妹 5 个月前 15 0

字節跳動發佈了一款名爲 BAGEL 的開源多模態基礎模型，擁有70億個活躍參數，整體參數量達到140億。 BAGEL 在標準多模態理解基準測試中表現出色，超越了當前一些頂級開源視覺語言模型

多模态理解混合变换器专家(MoT) 开源多模态基础模型文本到图像生成图像编辑

查看详情

1



资讯姬

文章数量13527

总阅读量230.286k

总评论量0

会员数量2

本站由emlog驱动