关闭导航

包含标签"Hugging Face"的内容

字节跳动开源DreamO:集成换装换脸等功能的一站式AI图像定制框架
AI妹 1 个月前 10 0

字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。AI

通义千问开源Qwen-Image多模态模型 文本渲染与图像编辑表现出色
AI妹 1 个月前 9 0

通義千問系列首次開源了一款名爲Qwen-Image的20億參數多模態擴散變換器(MMDiT)圖像生成基礎模型。這一創新成果不僅在複雜文本渲染和精確圖像編輯方面取得了突破性進展,更是在多個公開基準測

通义千问Qwen-Image开源 多模态图像生成编辑性能领先业界
AI妹 1 个月前 11 0

通義千問シリーズは、Qwen-Imageという20億パラメータのマルチモーダル・ディフュージョン・トランスフォーマー(MMDiT)画像生成ベースモデルを初めてオープンソース化しました。この革新的な

加州大学圣克鲁兹分校全新OpenVision视觉编码器:多样模型与灵活高效部署
AI妹 1 个月前 10 0

加州大學聖克魯茲分校近日宣佈推出 OpenVision,這是一個全新的視覺編碼器系列,旨在爲 OpenAI 的 CLIP 和谷歌的 SigLIP 等模型提供替代方案。OpenVision 的發佈爲

加州大学圣克鲁兹分校推出OpenVision视觉编码器系列替代CLIP/SigLIP高效灵活
AI妹 1 个月前 9 0

加州大学圣克鲁兹分校近日宣布推出 OpenVision,这是一个全新的视觉编码器系列,旨在为 OpenAI 的 CLIP 和谷歌的 SigLIP 等模型提供替代方案。OpenVision 的发布为

通义千问首次开源Qwen-Image多模态模型 图像生成编辑性能领先
AI妹 1 个月前 11 0

通义千问系列首次开源了一款名为Qwen-Image的20亿参数多模态扩散变换器(MMDiT)图像生成基础模型。这一创新成果不仅在复杂文本渲染和精确图像编辑方面取得了突破性进展,更是在多个公开基准测

加州大学新発表OpenVision視覚エンコーダ:多様性・効率性を兼ね備えたAI画像処理基盤
AI妹 1 个月前 9 0

カリフォルニア大学サンタクルズ校は最近、OpenVisionの発表を発表しました。これは、OpenAIのCLIPやGoogleのSigLIPなどのモデルに代わる新しい視覚エンコーダーシリー

通义千问开源Qwen-Image模型 文本渲染及图像编辑能力实现突破
AI妹 1 个月前 9 0

通义千问8月5日正式开源了其首个图像生成基础模型Qwen-Image,这款20B参数的MMDiT(多模态扩散变换器)模型在文本渲染和图像编辑领域实现了重大突破。该模型不仅在多个权威基准测试中获得了

通义千问开源Qwen-Image 图像生成模型技术突破与多场景应用
AI妹 1 个月前 10 0

通義千問は8月5日に、初めての画像生成基礎モデル「Qwen-Image」をオープンソースとしてリリースしました。この20Bパラメータを持つMMDiT(マルチモーダルディフュージョントランスフォーマ