关闭导航

包含标签"图表识别"的内容

百度发布文心大模型衍生PaddleOCR-VL-1.6权威评测刷新SOTA全球第一并开源代码权重
AI妹 7 天前 1 0

百度正式发布文心大模型衍生模型PaddleOCR-VL-1.6,在OmniDocBench v1.6权威评测中以96.33%的准确率超越Gemini-3-Pro、GPT-5.2及GLM-OCR等国

通义实验室开源VRAG-RL框架 解决视觉多模态RAG推理难题
AI妹 5 个月前 15 0

近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化