アップルがFastVLMを正式に発表しました。これは高解像度画像処理に最適化されたビジュアル言語モデル(VLM)で、iPhoneなどのモバイルデバイス上で効率的な動作と卓越したパフォーマンスを実現
蘋果正式發佈FastVLM,一款專爲高分辨率圖像處理優化的視覺語言模型(VLM),以其在iPhone等移動設備上的高效運行能力和卓越性能引發行業熱議。FastVLM通過創新的FastViTHD視覺
NVIDIAは最近、高品質な画像および動画の再ライティングおよびアンダーライティングを実現する新しいビデオ拡散フレームワークであるCosmos DiffusionRendererをリリースしました
NVIDIA 近期推出了 Cosmos DiffusionRenderer,这是一个旨在实现高质量图像和视频重光源及去光源的新型视频扩散框架。此技术是 NVIDIA 原有 DiffusionRen
NVIDIA 近期推出了 Cosmos DiffusionRenderer,這是一個旨在實現高質量圖像和視頻重光源及去光源的新型視頻擴散框架。此技術是 NVIDIA 原有 DiffusionRen
Googleは最近、自社の人工知能モデルコレクションであるGemmaのダウンロード数が1億5000万回を突破したことを発表しました。これは、プロジェクトが大きな進展を遂げたことを示しています。Go
Google 近期宣布,其人工智能模型集合 Gemma 的下载量已经突破1.5亿次,标志着该项目取得了显著进展。Google DeepMind 的开发者关系工程师 Omar Sanseviero
Google 近期宣佈,其人工智能模型集合 Gemma 的下載量已經突破1.5億次,標誌着該項目取得了顯著進展。Google DeepMind 的開發者關係工程師 Omar Sanseviero
オープンソースの音声合成(TTS)技術で新たな突破が達成されました! 先日公開されたMuyan-TTSは、ポッドキャスト、オーディオブック、長尺ビデオなど、特定のシナリオに特化した設計のオープンソ
开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一