关闭导航

包含标签"Hugging Face"的内容

开源TTS新突破:Muyan-TTS零shot快速生成高连贯长音频内容
AI妹 4 个月前 18 0

A new breakthrough has been achieved in open-source text-to-speech (TTS) technology! The recently

开源Muyan-TTS新模型发布 高效长语音生成助力内容创作
AI妹 4 个月前 18 0

開源語音合成迎來新突破!近日發佈的開源 TTS 模型 Muyan-TTS 專爲播客、有聲書、長視頻等場景設計,具備零樣本語音合成、極速生成與高連貫性朗讀能力,是當前最適合批量化長語音生成的模型之一

字节跳动开源DreamO画像定制框架 多功能驱动AI编辑革新
AI妹 4 个月前 18 0

字節跳動はHugging Faceプラットフォームで、新たな画像カスタマイズフレームワーク「DreamO」を正式にオープンソースとして公開しました。このフレームワークは、キャラクターの服替えや顔の

字节跳动开源DreamO框架 一站式图像定制引领AI编辑新突破
AI妹 4 个月前 15 0

字節跳動在Hugging Face平臺正式開源了全新圖像定製框架DreamO,這一框架集成了圖像換裝、換臉、造型調整、風格遷移以及多主體組合等多種功能,爲AI圖像編輯領域帶來了全新的技術突破。AI

字节跳动开源DreamO:一站式AI图像定制框架其核心亮点与行业深远影响
AI妹 4 个月前 16 0

ByteDance has officially open-sourced the new image customization framework, DreamO, on the Huggin

字节跳动开源DreamO:集成换装换脸等功能的一站式AI图像定制框架
AI妹 4 个月前 17 0

字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。AI

通义千问开源Qwen-Image多模态模型 文本渲染与图像编辑表现出色
AI妹 4 个月前 15 0

通義千問系列首次開源了一款名爲Qwen-Image的20億參數多模態擴散變換器(MMDiT)圖像生成基礎模型。這一創新成果不僅在複雜文本渲染和精確圖像編輯方面取得了突破性進展,更是在多個公開基準測

通义千问Qwen-Image开源 多模态图像生成编辑性能领先业界
AI妹 4 个月前 16 0

通義千問シリーズは、Qwen-Imageという20億パラメータのマルチモーダル・ディフュージョン・トランスフォーマー(MMDiT)画像生成ベースモデルを初めてオープンソース化しました。この革新的な

加州大学圣克鲁兹分校全新OpenVision视觉编码器:多样模型与灵活高效部署
AI妹 4 个月前 11 0

加州大學聖克魯茲分校近日宣佈推出 OpenVision,這是一個全新的視覺編碼器系列,旨在爲 OpenAI 的 CLIP 和谷歌的 SigLIP 等模型提供替代方案。OpenVision 的發佈爲