多模态大语言模型 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"多模态大语言模型"的内容

字节跳动Seed与港科大发布MMProLong 多模态长文档处理获显著突破

字节跳动Seed与港科大发布MMProLong 多模态长文档处理获显著突破

AI妹 15 天前 1 0

5月24日，字节跳动Seed团队联合香港科技大学发布了一项针对多模态大语言模型（LMM）长文档训练的最新研究成果。研究人员基于阿里巴巴开源的 Qwen2.5-VL

长上下文问答对 Gemma3-27B OCR转录 Qwen3-VL-8B Deepseek

查看详情

Chronicles-OCR古文字基准发布主流大模型识别表现不尽如人意

Chronicles-OCR古文字基准发布主流大模型识别表现不尽如人意

AI妹 21 天前 1 0

顶尖的人工智能不仅要能看懂屏幕上跳动的现代代码，也需要读懂三千年前龟甲上的刻痕。据OSCHINA报道，腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院，正式推出了“Chronic

Chronicles-OCR 字体分类腾讯混元大模型汉字七体之变金文

查看详情

业界首个七体古文字识别基准Chronicles-OCR发布推动数字人文技术突破

业界首个七体古文字识别基准Chronicles-OCR发布推动数字人文技术突破

AI妹 22 天前 2 0

5月18日，腾讯混元、SSV数字文化实验室及SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学，正式发布了业界首个覆盖“七体之变”完整演化轨迹的中国古文字识别评测基准

古文转写楷书行书 Chronicles-OCR 细粒度古字识别

查看详情

DeepSeek V4下周发布多模态生成填补国内低成本开源模型空白

DeepSeek V4下周发布多模态生成填补国内低成本开源模型空白

AI妹 3 个月前 4 0

据报道，深度求索（DeepSeek）将在下周推出其最新的多模态大语言模型 V4。这一新模型将原生支持图片、视频和文本的 AI 生成能力，标志着 DeepSeek 自 2025 年 1 月推出 R1

AI创作教育寒武纪文本生成技术透明化

查看详情

深度求索下周发布多模态大模型V4 联合华为寒武纪适配填补市场空白

深度求索下周发布多模态大模型V4 联合华为寒武纪适配填补市场空白

AI妹 3 个月前 6 0

据《金融时报》2月28日报道，深度求索（DeepSeek）将于下周发布全新多模态大语言模型 V4。该模型原生支持图片、视频与文本生成，是继今年1月 R1推理模型发布后的首次重大更新，旨在填补国内高

华为多模态大语言模型本土AI算力生态国产芯片 DeepSeek V4

查看详情

WORLDMEM框架Hugging Face开源记忆驱动世界模拟新突破

WORLDMEM框架Hugging Face开源记忆驱动世界模拟新突破

AI妹 5 个月前 18 0

この度、WORLDMEMフレームワークがHugging Faceプラットフォームで正式にオープンソースとして公開されました。これは、長期的整合性を持つ世界シミュレーション技術における重要なブレーク

虚拟环境模拟内存机制虚拟环境建模多感官互动注意力模块

查看详情

NVIDIA DAM-3B多模态模型：区域化描述突破开源赋能多领域创新应用

NVIDIA DAM-3B多模态模型：区域化描述突破开源赋能多领域创新应用

AI妹 5 个月前 19 0

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B（DAM-3B），专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能，在多模

内容创作评估基准 DAM-3B Focal Prompt 多模态大语言模型

查看详情

NVIDIA发布DAM-3B多模态模型区域化描述突破开源推动多行业应用

NVIDIA发布DAM-3B多模态模型区域化描述突破开源推动多行业应用

AI妹 5 个月前 19 0

NVIDIA AI團隊發佈了一款革命性的多模態大語言模型——Describe Anything3B（DAM-3B），專爲圖像和視頻的精細化、區域化描述而設計。這款模型憑藉創新技術和卓越性能，在多模

开源 Describe Anything3B 区域化描述视频分析 NVIDIA AI

查看详情

NVIDIA DAM-3B：局所图像视频描述新突破开源助力多领域应用

NVIDIA DAM-3B：局所图像视频描述新突破开源助力多领域应用

AI妹 5 个月前 16 0

NVIDIA AIチームは、画像と動画の精密で局所的な記述を目的とした画期的なマルチモーダル大規模言語モデル、Describe Anything 3B（DAM-3B）を発表しました。このモデルは、

开源无障碍技术 NVIDIA AI 视频分析门控交叉注意力

查看详情

Simular AI浏览器智能体登陆macOS 本地运行与人机协作为核心

Simular AI浏览器智能体登陆macOS 本地运行与人机协作为核心

AI妹 5 个月前 17 0

Simular AI正式亮相macOS，成爲首個運行於用戶本地設備的AI瀏覽器智能體，強調人機協作與本地化處理。據AIbase瞭解，Simular通過理解屏幕內容、自動化網頁操作與無縫協同功能，支

自动化网页操作教育学习 M系列芯片 simular.ai Model Context Protocol

查看详情

1



资讯姬

文章数量13535

总阅读量233.893k

总评论量0

会员数量2

本站由emlog驱动