字节跳动 Seed 团队正式对外发布其最新研发成果——Seed LiveInterpret2.0端到端同声传译大模型。这一模型的发布标志着机器同声传译技术取得了重大突破,其翻译准确率接近专业同传译
智谱 AI 正式推出了其最新的 GLM-ASR 系列语音识别模型,并将相关技术开源,旨在为广大用户提供更高效的语音交互体验。这一系列的推出还包括了一款桌面端的 “智谱 AI 输入法”,为用户在 P
2025光明科学城论坛・大湾区智能算力与大模型智能体论坛在深圳光明区举行,鹏城实验室、琶洲实验室、工商银行等机构集中发布四项重大成果: - 鹏城脑海2.1开源488B 多模态模型,同步放出2TB
商汤科技联合南洋理工大学 S-Lab 发布行业首个原生多模态架构 NEO,并同步开源2B 与9B 两款模型。新架构摒弃“视觉编码器 + 投影器 + 语言模型”的传统三段式方案,从注意力机制、位置编
近日,腾讯正式推出其全新开源模型 HunyuanOCR,参数量仅为1B。该模型基于腾讯独创的混元多模态架构设计,已在多个行业标准的 OCR 应用中取得了 SOTA(最先进水平)的佳绩。腾讯方面表示
11月25日,腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿(1B),依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩,
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论