由上海人工智能实验室发布的“万卷·丝路2.0”多语言多模态语料库正式开源。该语料库在原有的阿拉伯语、俄语、韩语、越南语、泰语等5个语种基础上,新增了塞尔维亚语、匈牙利语、捷克语3个稀缺语料数据,涵
在人工智能迅速发展的今天,上海人工智能实验室再次引领潮流,推出了全新的多模态大模型 “书生・万象3.0”。这一升级版本不仅在技术上进行了全面提升,还在多模态预训练和后训练方法的加持下,展现出了更强
In today's rapidly advancing AI landscape, the Shanghai Artificial Intelligence Laboratory is once
人工知能(AI)の急速な進歩の時代において、上海AI研究所は新たな基準を打ち立て、新しいマルチモーダル大規模モデル「Shusheng・Wanxiang 3.0」を発表しました。このアップデート版は
在人工智能迅速發展的今天,上海人工智能實驗室再次引領潮流,推出了全新的多模態大模型 “書生・萬象3.0”。這一升級版本不僅在技術上進行了全面提升,還在多模態預訓練和後訓練方法的加持下,展現出了更強
字節跳動豆包大模型團隊宣佈開源 UI-TARS-1.5,這是一款基於視覺 - 語言模型構建的開源多模態智能體,能夠在虛擬世界中高效執行各類任務。該模型在7個典型的 GUI 圖形用戶界面評測基準中取
阿里巴巴近日宣布,其最新首尾帧生成视频模型Wan2.1-FLF2V-14B正式开源,支持生成5秒720p高清视频。这一模型以其创新的首尾帧控制技术引发广泛关注,为AI视频生成领域带来全新可能性。据
バイトダンスのDoubao大規模言語モデルチームは、視覚言語モデルに基づいたオープンソースのマルチモーダルエージェントであるUI-TARS-1.5のオープンソース化を発表しました。これは、仮想世界
アリババの通義は、強力な始終フレーム生成ビデオモデルを含むWan2.1シリーズモデルのオープンソース化を発表しました。このモデルは高度なDiTアーキテクチャを採用しており、技術的に複数のブレークス
字节跳动在Hugging Face平台正式发布了UI-TARS-1.5,一款基于强大视觉语言模型构建的开源多模态代理。这一发布标志着字节跳动在AI自动化交互领域的又一重大突破,为开发者与用户提供了
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论