5月24日,字节跳动Seed团队联合香港科技大学发布了一项针对多模态大语言模型(LMM)长文档训练的最新研究成果。研究人员基于阿里巴巴开源的 Qwen2.5-VL
顶尖的人工智能不仅要能看懂屏幕上跳动的现代代码,也需要读懂三千年前龟甲上的刻痕。据OSCHINA报道,腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院,正式推出了“Chronic
5月18日,腾讯混元、SSV数字文化实验室及SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学,正式发布了业界首个覆盖“七体之变”完整演化轨迹的中国古文字识别评测基准
据报道,深度求索(DeepSeek)将在下周推出其最新的多模态大语言模型 V4。这一新模型将原生支持图片、视频和文本的 AI 生成能力,标志着 DeepSeek 自 2025 年 1 月推出 R1
据《金融时报》2月28日报道,深度求索(DeepSeek)将于下周发布全新多模态大语言模型 V4。该模型原生支持图片、视频与文本生成,是继今年1月 R1推理模型发布后的首次重大更新,旨在填补国内高
この度、WORLDMEMフレームワークがHugging Faceプラットフォームで正式にオープンソースとして公開されました。これは、長期的整合性を持つ世界シミュレーション技術における重要なブレーク
NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模
NVIDIA AI團隊發佈了一款革命性的多模態大語言模型——Describe Anything3B(DAM-3B),專爲圖像和視頻的精細化、區域化描述而設計。這款模型憑藉創新技術和卓越性能,在多模
NVIDIA AIチームは、画像と動画の精密で局所的な記述を目的とした画期的なマルチモーダル大規模言語モデル、Describe Anything 3B(DAM-3B)を発表しました。このモデルは、
Simular AI正式亮相macOS,成爲首個運行於用戶本地設備的AI瀏覽器智能體,強調人機協作與本地化處理。據AIbase瞭解,Simular通過理解屏幕內容、自動化網頁操作與無縫協同功能,支