关闭导航

包含标签"OmniDocBench"的内容

LongCat-Next原生多模态大模型发布开源 打破模态阻隔推动产业落地
AI妹 5 天前 1 0

全球人工智能界正迎来一场关于“AI母语”的技术革新。针对当前大模型普遍存在的“以语言为中心、外挂视觉或语音模块”的拼凑式异构架构,大模型研发团队于近日正式发布并开源了全新原生多模态大模型 Long

稀宇科技发布新一代MiniMax M3 集三大顶尖能力的全球唯一开源大模型
AI妹 8 天前 1 0

国内大模型赛道迎来硬核技术突破。6月1日,稀宇科技正式发布了新一代大语言模型—— MiniMax M3 。该模型凭借前沿的编程实力、最高支持1M(100万)的超长

稀宇科技重磅发布MiniMax M3新大模型 集三大核心能力成国内首个开源模型
AI妹 8 天前 0 0

国内人工智能领域迎来重大技术突破。稀宇科技于今日正式发布了新一代大模型MiniMax M3,该模型不仅具备前沿的编程能力,还支持高达1M( 100 万)的超长上下文。更引人瞩目 border 的是

美团发布全模态统一LongCat-Next原生多模态大模型 高效压缩性能领先并开源
AI妹 2 个月前 3 0

4 月 3 日, 美团技术团队 正式发布原生多模态大模型 LongCat-Next 。该模型突破了传统“语言基座+插件”的拼凑架构,通过将

DeepSeek发布OCR2:架构创新能效高,文档处理性能超Gemini3Pro
AI妹 4 个月前 59 0

 中国 AI 领军企业 DeepSeek 近日发布了全新的视觉编码器 DeepSeek OCR2,在文档处理和图像识别领域实现重大突破。该模型通过模拟人类视觉的灵活扫描模式,彻底颠覆了传

百度飞桨发布PaddleOCR3.0开源版 多语言手写及文档解析能力增强
AI妹 5 个月前 17 0

2025年5月20日,百度飛槳團隊正式發佈了PaddleOCR3.0版本,並對外開源。這一新版本在文字識別精度、多語種支持、手寫體識別以及高精度文檔解析等方面取得了顯著進展,進一步提升了Paddl

百度PaddleOCR3.0于2025年5月开源 多项核心升级提升OCR能力
AI妹 5 个月前 17 0

On May 20, 2025, the PaddleOCR team from Baidu officially released version 3.0 of PaddleOCR and ma

百度PaddleOCR3.0发布:多模型升级 精度提升文档分析强化
AI妹 5 个月前 15 0

2025年5月20日、百度のPaddleOCRチームはバージョン3.0を公開し、それを一般に開放しました。この新しいバージョンは、テキスト認識精度、多言語サポート、手書き文字認識、そして高精度なド

腾讯混元开源HunyuanOCR模型 10亿参数轻量化高效性能获多项SOTA
AI妹 6 个月前 27 0

11月25日,腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿(1B),依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩,