关闭导航

包含标签"复杂文档解析"的内容

英伟达发布Nemotron3 Nano Omni多模态模型 整合视音频图文效率高表现优异
AI妹 1 个月前 2 0

英伟达发布了其开放式多模态模型 “Nemotron 3 Nano Omni”,这款新模型将视频、音频、图像和文本的推理能力整合到一个系统中,旨在为用户提供更快速和智能的响应。根据英伟达的介绍,这款

腾讯开源1B参数量HunyuanOCR模型 端到端设计获多场景SOTA并支持多语种
AI妹 6 个月前 21 0

近日,腾讯正式推出其全新开源模型 HunyuanOCR,参数量仅为1B。该模型基于腾讯独创的混元多模态架构设计,已在多个行业标准的 OCR 应用中取得了 SOTA(最先进水平)的佳绩。腾讯方面表示