关闭导航

包含标签"多模态大语言模型"的内容

字节跳动Seed与港科大发布MMProLong 多模态长文档处理获显著突破
AI妹 15 天前 1 0

5月24日,字节跳动Seed团队联合香港科技大学发布了一项针对多模态大语言模型(LMM)长文档训练的最新研究成果。研究人员基于阿里巴巴开源的 Qwen2.5-VL

Chronicles-OCR古文字基准发布 主流大模型识别表现不尽如人意
AI妹 21 天前 1 0

顶尖的人工智能不仅要能看懂屏幕上跳动的现代代码,也需要读懂三千年前龟甲上的刻痕。据OSCHINA报道,腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院,正式推出了“Chronic

业界首个七体古文字识别基准Chronicles-OCR发布 推动数字人文技术突破
AI妹 22 天前 2 0

5月18日,腾讯混元、SSV数字文化实验室及SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学,正式发布了业界首个覆盖“七体之变”完整演化轨迹的中国古文字识别评测基准

DeepSeek V4下周发布 多模态生成 填补国内低成本开源模型空白
AI妹 3 个月前 4 0

据报道,深度求索(DeepSeek)将在下周推出其最新的多模态大语言模型 V4。这一新模型将原生支持图片、视频和文本的 AI 生成能力,标志着 DeepSeek 自 2025 年 1 月推出 R1

深度求索下周发布多模态大模型V4 联合华为寒武纪适配填补市场空白
AI妹 3 个月前 6 0

据《金融时报》2月28日报道,深度求索(DeepSeek)将于下周发布全新多模态大语言模型 V4。该模型原生支持图片、视频与文本生成,是继今年1月 R1推理模型发布后的首次重大更新,旨在填补国内高

WORLDMEM框架Hugging Face开源 记忆驱动世界模拟新突破
AI妹 5 个月前 18 0

この度、WORLDMEMフレームワークがHugging Faceプラットフォームで正式にオープンソースとして公開されました。これは、長期的整合性を持つ世界シミュレーション技術における重要なブレーク

NVIDIA DAM-3B多模态模型:区域化描述突破 开源赋能多领域创新应用
AI妹 5 个月前 19 0

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模

NVIDIA发布DAM-3B多模态模型 区域化描述突破开源推动多行业应用
AI妹 5 个月前 19 0

NVIDIA AI團隊發佈了一款革命性的多模態大語言模型——Describe Anything3B(DAM-3B),專爲圖像和視頻的精細化、區域化描述而設計。這款模型憑藉創新技術和卓越性能,在多模

NVIDIA DAM-3B:局所图像视频描述新突破 开源助力多领域应用
AI妹 5 个月前 16 0

NVIDIA AIチームは、画像と動画の精密で局所的な記述を目的とした画期的なマルチモーダル大規模言語モデル、Describe Anything 3B(DAM-3B)を発表しました。このモデルは、

Simular AI浏览器智能体登陆macOS 本地运行与人机协作为核心
AI妹 5 个月前 17 0

Simular AI正式亮相macOS,成爲首個運行於用戶本地設備的AI瀏覽器智能體,強調人機協作與本地化處理。據AIbase瞭解,Simular通過理解屏幕內容、自動化網頁操作與無縫協同功能,支