Hugging Face - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"Hugging Face"的内容

开源TTS新突破：Muyan-TTS零shot快速生成高连贯长音频内容

开源TTS新突破：Muyan-TTS零shot快速生成高连贯长音频内容

AI妹 4 个月前 18 0

A new breakthrough has been achieved in open-source text-to-speech (TTS) technology! The recently

high-coherence reading open-source text-to-speech audiobook production open-source address podcasts

查看详情

开源Muyan-TTS新模型发布高效长语音生成助力内容创作

开源Muyan-TTS新模型发布高效长语音生成助力内容创作

AI妹 4 个月前 18 0

開源語音合成迎來新突破!近日發佈的開源 TTS 模型 Muyan-TTS 專爲播客、有聲書、長視頻等場景設計，具備零樣本語音合成、極速生成與高連貫性朗讀能力，是當前最適合批量化長語音生成的模型之一

离线部署零样本语音合成英文视频配音 Muyan-TTS AI角色朗读

查看详情

字节跳动开源DreamO画像定制框架多功能驱动AI编辑革新

字节跳动开源DreamO画像定制框架多功能驱动AI编辑革新

AI妹 4 个月前 18 0

字節跳動はHugging Faceプラットフォームで、新たな画像カスタマイズフレームワーク「DreamO」を正式にオープンソースとして公開しました。このフレームワークは、キャラクターの服替えや顔の

クリエイティブデザイン IDパラメータ複数主体の組み合わせ AI画像編集スタイル変換

查看详情

字节跳动开源DreamO框架一站式图像定制引领AI编辑新突破

字节跳动开源DreamO框架一站式图像定制引领AI编辑新突破

AI妹 4 个月前 15 0

字節跳動在Hugging Face平臺正式開源了全新圖像定製框架DreamO，這一框架集成了圖像換裝、換臉、造型調整、風格遷移以及多主體組合等多種功能，爲AI圖像編輯領域帶來了全新的技術突破。AI

开源 AI开源生态社交媒体短视频风格迁移字节跳动

查看详情

字节跳动开源DreamO：一站式AI图像定制框架其核心亮点与行业深远影响

字节跳动开源DreamO：一站式AI图像定制框架其核心亮点与行业深远影响

AI妹 4 个月前 16 0

ByteDance has officially open-sourced the new image customization framework, DreamO, on the Huggin

Style parameter multi-subject combination technical innovation IP parameter ByteDance

查看详情

字节跳动开源DreamO：集成换装换脸等功能的一站式AI图像定制框架

字节跳动开源DreamO：集成换装换脸等功能的一站式AI图像定制框架

AI妹 4 个月前 17 0

字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO，这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能，为AI图像编辑领域带来了全新的技术突破。AI

创意设计换脸 AI图像编辑字节跳动 Diffusion Transformer

查看详情

通义千问开源Qwen-Image多模态模型文本渲染与图像编辑表现出色

通义千问开源Qwen-Image多模态模型文本渲染与图像编辑表现出色

AI妹 4 个月前 15 0

通義千問系列首次開源了一款名爲Qwen-Image的20億參數多模態擴散變換器（MMDiT）圖像生成基礎模型。這一創新成果不僅在複雜文本渲染和精確圖像編輯方面取得了突破性進展，更是在多個公開基準測

多行布局 GitHub 图像编辑中英文文本生成物体增减

查看详情

通义千问Qwen-Image开源多模态图像生成编辑性能领先业界

通义千问Qwen-Image开源多模态图像生成编辑性能领先业界

AI妹 4 个月前 16 0

通義千問シリーズは、Qwen-Imageという20億パラメータのマルチモーダル・ディフュージョン・トランスフォーマー（MMDiT）画像生成ベースモデルを初めてオープンソース化しました。この革新的な

QwenChat 图像编辑 Demo GenEval 图像生成基础模型

查看详情

Qwen-Image开源模型：文本渲染精准图像编辑强性能卓越

（注：标题含英文部分共约30字符，涵盖核心亮点：开源属性、文本渲染优势、图像编辑能力及优异性能。）

Qwen-Image开源模型：文本渲染精准图像编辑强性能卓越（注：标题含英文部分共约30字符，涵盖核心亮点：开源属性、文本渲染优势、图像编辑能力及优异性能。）

AI妹 4 个月前 15 0

The Qwen-Image, a 2 billion parameter multimodal diffusion transformer (MMDiT) image generation fo

MMDiT 复杂文本渲染 OneIG-Bench DPG 风格迁移

查看详情

加州大学圣克鲁兹分校全新OpenVision视觉编码器：多样模型与灵活高效部署

加州大学圣克鲁兹分校全新OpenVision视觉编码器：多样模型与灵活高效部署

AI妹 4 个月前 11 0

加州大學聖克魯茲分校近日宣佈推出 OpenVision，這是一個全新的視覺編碼器系列，旨在爲 OpenAI 的 CLIP 和谷歌的 SigLIP 等模型提供替代方案。OpenVision 的發佈爲

Smol-LM MSCOCO 自适应补丁大小 JAX 视觉编码器

查看详情

...

22

...



资讯姬

文章数量12058

总阅读量203.186k

总评论量0

会员数量2

本站由emlog驱动