关闭导航

包含标签"多模态大语言模型"的内容

WORLDMEM框架Hugging Face开源 记忆驱动世界模拟新突破
AI妹 1 个月前 9 0

この度、WORLDMEMフレームワークがHugging Faceプラットフォームで正式にオープンソースとして公開されました。これは、長期的整合性を持つ世界シミュレーション技術における重要なブレーク

NVIDIA DAM-3B多模态模型:区域化描述突破 开源赋能多领域创新应用
AI妹 1 个月前 9 0

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模

NVIDIA发布DAM-3B多模态模型 区域化描述突破开源推动多行业应用
AI妹 1 个月前 8 0

NVIDIA AI團隊發佈了一款革命性的多模態大語言模型——Describe Anything3B(DAM-3B),專爲圖像和視頻的精細化、區域化描述而設計。這款模型憑藉創新技術和卓越性能,在多模

NVIDIA DAM-3B:局所图像视频描述新突破 开源助力多领域应用
AI妹 1 个月前 9 0

NVIDIA AIチームは、画像と動画の精密で局所的な記述を目的とした画期的なマルチモーダル大規模言語モデル、Describe Anything 3B(DAM-3B)を発表しました。このモデルは、

Simular AI浏览器智能体登陆macOS 本地运行与人机协作为核心
AI妹 1 个月前 10 0

Simular AI正式亮相macOS,成爲首個運行於用戶本地設備的AI瀏覽器智能體,強調人機協作與本地化處理。據AIbase瞭解,Simular通過理解屏幕內容、自動化網頁操作與無縫協同功能,支

Simular AI亮相macOS:首个本地运行的人机协作智能浏览器智能体
AI妹 1 个月前 11 0

Simular AI正式亮相macOS,成为首个运行于用户本地设备的AI浏览器智能体,强调人机协作与本地化处理。据AIbase了解,Simular通过理解屏幕内容、自动化网页操作与无缝协同功能,支

谷歌借Gemini推三项AI语言新实验 赋能个性化动态学习体验
AI妹 1 个月前 8 0

谷歌宣布推出三项新的人工智能实验,旨在帮助用户以更个性化的方式学习语言。虽然这些实验尚处于初期阶段,但它们显示出谷歌可能正在试图与 Duolingo 等语言学习平台竞争,这些工具得益于谷歌的多模态

Unitree发布R1全尺寸人形机器人 39900元起售刷新价格下限
AI妹 1 个月前 10 0

近年、人形ロボット分野における競争はますます激しくなっており、中国のロボット製造企業であるUnitree Roboticsはそのイノベーション技術と競争力のある価格戦略により業界を再び注目を集めて

字节跳动联合港大、华科推出UniTok视觉分词器 赋能多模态与视觉任务
AI妹 1 个月前 8 0

近日,字节跳动联合香港大学和华中科技大学共同推出了全新的视觉分词器 UniTok。这款工具不仅能在视觉生成和理解任务中发挥作用,还在技术上进行了重要创新,解决了传统分词器在细节捕捉与语义理解之间的

字节跳动清华联合发布ChatTS时序多模大模型 成果获VLDB2025接受
AI妹 1 个月前 8 0

在多模態大語言模型(MLLM)迅速發展的浪潮中,字節跳動與清華大學近日聯合發佈了名爲 ChatTS 的新型時序多模態大模型。ChatTS 的推出不僅爲時序數據的處理與推理注入了新活力,也填補了當前