ByteDance's Doubao large model team announced the open-source release of UI-TARS-1.5, a multi-moda
阿里通義宣佈開源 Wan2.1系列模型,其中包括強大的首尾幀生視頻模型。這一模型採用了先進的 DiT 架構,在技術上實現了多項突破,顯著降低了高清視頻生成的運算成本,同時確保了生成視頻在時間與空間
小米大模型团队宣布开源最新一代多模态大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 与 SFT 两个版本。 官方数据显示,新版模型在学科推理、文档理解、图形界面定位及视频理解四
2025年5月20日,百度飛槳團隊正式發佈了PaddleOCR3.0版本,並對外開源。這一新版本在文字識別精度、多語種支持、手寫體識別以及高精度文檔解析等方面取得了顯著進展,進一步提升了Paddl
7月7日,百度AI團隊宣佈PaddleOCR3.1版本正式上線,在多語種識別、複雜文檔翻譯及大模型連接能力上實現三大升級。新版本支持37種語言的文本識別,平均精度提升超30%,並推出文檔翻譯產線與
7月7日,百度AI团队宣布PaddleOCR3.1版本正式上线,在多语种识别、复杂文档翻译及大模型连接能力上实现三大升级。新版本支持37种语言的文本识别,平均精度提升超30%,并推出文档翻译产线与
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论