关闭导航

包含标签"Hugging Face"的内容

苹果正式发布FastVLM:FastViTHD驱动革新性高分辨率VLM赋能移动高效AI应用体验
AI妹 4 个月前 14 0

アップルがFastVLMを正式に発表しました。これは高解像度画像処理に最適化されたビジュアル言語モデル(VLM)で、iPhoneなどのモバイルデバイス上で効率的な動作と卓越したパフォーマンスを実現

苹果发布FastVLM:高分辨率优化 移动端高效运行的多模态视觉语言模型
AI妹 4 个月前 15 0

蘋果正式發佈FastVLM,一款專爲高分辨率圖像處理優化的視覺語言模型(VLM),以其在iPhone等移動設備上的高效運行能力和卓越性能引發行業熱議。FastVLM通過創新的FastViTHD視覺

NVIDIA新发布Cosmos DiffusionRenderer 升级实现高画质图像视频重光照再渲染
AI妹 4 个月前 12 0

NVIDIAは最近、高品質な画像および動画の再ライティングおよびアンダーライティングを実現する新しいビデオ拡散フレームワークであるCosmos DiffusionRendererをリリースしました

NVIDIA Cosmos DiffusionRenderer:图像视频重光源去光源技术的重大升级
AI妹 4 个月前 15 0

NVIDIA 近期推出了 Cosmos DiffusionRenderer,这是一个旨在实现高质量图像和视频重光源及去光源的新型视频扩散框架。此技术是 NVIDIA 原有 DiffusionRen

NVIDIA Cosmos DiffusionRenderer升级版 可处理图像视频重光源去光源
AI妹 4 个月前 12 0

NVIDIA 近期推出了 Cosmos DiffusionRenderer,這是一個旨在實現高質量圖像和視頻重光源及去光源的新型視頻擴散框架。此技術是 NVIDIA 原有 DiffusionRen

Google Gemma AI模型下载破1.5亿次 多模态多语言受关注与Llama竞争存争议
AI妹 4 个月前 13 0

Googleは最近、自社の人工知能モデルコレクションであるGemmaのダウンロード数が1億5000万回を突破したことを発表しました。これは、プロジェクトが大きな進展を遂げたことを示しています。Go

Google Gemma模型下载破1.5亿 多模态特性引竞争与许可争议
AI妹 4 个月前 15 0

Google 近期宣布,其人工智能模型集合 Gemma 的下载量已经突破1.5亿次,标志着该项目取得了显著进展。Google DeepMind 的开发者关系工程师 Omar Sanseviero

Google Gemma模型下载破1.5亿 多模態特性與Llama競爭引關注
AI妹 4 个月前 18 0

Google 近期宣佈,其人工智能模型集合 Gemma 的下載量已經突破1.5億次,標誌着該項目取得了顯著進展。Google DeepMind 的開發者關係工程師 Omar Sanseviero

开源TTS新突破Muyan-TTS:超高速生成 多场景适配 支持定制化
AI妹 4 个月前 18 0

オープンソースの音声合成(TTS)技術で新たな突破が達成されました! 先日公開されたMuyan-TTSは、ポッドキャスト、オーディオブック、長尺ビデオなど、特定のシナリオに特化した設計のオープンソ

开源TTS模型Muyan-TTS发布 适配长语音生成多场景支持说话人定制开源高效
AI妹 4 个月前 18 0

开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一