商汤科技联合南洋理工大学 S-Lab 发布行业首个原生多模态架构 NEO,并同步开源2B 与9B 两款模型。新架构摒弃“视觉编码器 + 投影器 + 语言模型”的传统三段式方案,从注意力机制、位置编
近日,腾讯正式推出其全新开源模型 HunyuanOCR,参数量仅为1B。该模型基于腾讯独创的混元多模态架构设计,已在多个行业标准的 OCR 应用中取得了 SOTA(最先进水平)的佳绩。腾讯方面表示
11月25日,腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿(1B),依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩,