由清華大學語音與語言實驗室(Tencent AI Lab)聯合上海創智學院、復旦大學和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式開源,標誌着AI語音
腾讯は最近、新たなマルチモーダルカスタムビデオ生成フレームワークであるHunyuanCustomを正式にオープンソースとして公開しました。これにより、AIビデオクリエイションがより高い自由度と精密
由清华大学语音与语言实验室(Tencent AI Lab)联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式开源,标志着AI语音
Tencent has officially open-sourced its brand new multi-modal custom video generation framework —
一款名爲SurfSense的開源AI研究助手橫空出世,以其獨特的個人知識庫整合功能和強大的研究能力,迅速成爲NotebookLM和Perplexity的有力競爭者。SurfSense不僅繼承了AI
字節跳動Seed團隊正式推出全新開源代碼模型Seed-Coder,以其卓越的代碼生成、補全、編輯及推理能力引發業界廣泛關注。作爲一款8B參數規模的模型,Seed-Coder在多個基準測試中超越同級
Apple has officially released FastVLM, a visual language model (VLM) optimized for high-resolution
NVIDIA AI研究团队发布了一项突破性技术——Audio-SDS,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,显著提升了音效生成、音源分离
最近、日本経済新聞(NIKKEI)は注目を集める記事を発表し、アリババのQwen大規模モデルが急速に日本の人工知能開発において重要な基盤として役立っていることを指摘しました。世界中のAI技術が急速
苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。FastVLM通过创新的FastViTHD视觉