全球人工智能界正迎来一场关于“AI母语”的技术革新。针对当前大模型普遍存在的“以语言为中心、外挂视觉或语音模块”的拼凑式异构架构,大模型研发团队于近日正式发布并开源了全新原生多模态大模型 Long
国内大模型赛道迎来硬核技术突破。6月1日,稀宇科技正式发布了新一代大语言模型—— MiniMax M3 。该模型凭借前沿的编程实力、最高支持1M(100万)的超长
国内人工智能领域迎来重大技术突破。稀宇科技于今日正式发布了新一代大模型MiniMax M3,该模型不仅具备前沿的编程能力,还支持高达1M( 100 万)的超长上下文。更引人瞩目 border 的是
4 月 3 日, 美团技术团队 正式发布原生多模态大模型 LongCat-Next 。该模型突破了传统“语言基座+插件”的拼凑架构,通过将
中国 AI 领军企业 DeepSeek 近日发布了全新的视觉编码器 DeepSeek OCR2,在文档处理和图像识别领域实现重大突破。该模型通过模拟人类视觉的灵活扫描模式,彻底颠覆了传
2025年5月20日,百度飛槳團隊正式發佈了PaddleOCR3.0版本,並對外開源。這一新版本在文字識別精度、多語種支持、手寫體識別以及高精度文檔解析等方面取得了顯著進展,進一步提升了Paddl
On May 20, 2025, the PaddleOCR team from Baidu officially released version 3.0 of PaddleOCR and ma
2025年5月20日、百度のPaddleOCRチームはバージョン3.0を公開し、それを一般に開放しました。この新しいバージョンは、テキスト認識精度、多言語サポート、手書き文字認識、そして高精度なド
11月25日,腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿(1B),依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩,