关闭导航

包含标签"OmniDocBench"的内容

美团发布全模态统一LongCat-Next原生多模态大模型 高效压缩性能领先并开源
AI妹 12 天前 2 0

4 月 3 日, 美团技术团队 正式发布原生多模态大模型 LongCat-Next 。该模型突破了传统“语言基座+插件”的拼凑架构,通过将

DeepSeek发布OCR2:架构创新能效高,文档处理性能超Gemini3Pro
AI妹 2 个月前 56 0

 中国 AI 领军企业 DeepSeek 近日发布了全新的视觉编码器 DeepSeek OCR2,在文档处理和图像识别领域实现重大突破。该模型通过模拟人类视觉的灵活扫描模式,彻底颠覆了传

百度飞桨发布PaddleOCR3.0开源版 多语言手写及文档解析能力增强
AI妹 3 个月前 15 0

2025年5月20日,百度飛槳團隊正式發佈了PaddleOCR3.0版本,並對外開源。這一新版本在文字識別精度、多語種支持、手寫體識別以及高精度文檔解析等方面取得了顯著進展,進一步提升了Paddl

百度PaddleOCR3.0于2025年5月开源 多项核心升级提升OCR能力
AI妹 3 个月前 14 0

On May 20, 2025, the PaddleOCR team from Baidu officially released version 3.0 of PaddleOCR and ma

百度PaddleOCR3.0发布:多模型升级 精度提升文档分析强化
AI妹 3 个月前 13 0

2025年5月20日、百度のPaddleOCRチームはバージョン3.0を公開し、それを一般に開放しました。この新しいバージョンは、テキスト認識精度、多言語サポート、手書き文字認識、そして高精度なド

腾讯混元开源HunyuanOCR模型 10亿参数轻量化高效性能获多项SOTA
AI妹 4 个月前 24 0

11月25日,腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿(1B),依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩,