关闭导航

包含标签"视频理解"的内容

字节跳动发布Seed1.5-VL视觉语言多模态模型 高性能低成本强推理且开放API
AI妹 1 个月前 8 0

在上海舉辦的火山引擎 FORCE LINK AI 創新巡展上,字節跳動正式發佈了最新的視覺 - 語言多模態模型 ——Seed1.5-VL。該模型憑藉其出色的通用多模態理解和推理能力,成爲此次活動的

OpenBMB开源MiniCPM-V4.0:轻量多模态大模型革新移动端AI体验
AI妹 1 个月前 9 0

 OpenBMB 團隊近日宣佈,新一代多模態大模型 MiniCPM-V4.0 正式開源發佈。該模型憑藉其輕量級架構和卓越性能,被譽爲“手機上的 GPT-4V”,有望爲移動設備上的 AI

MiniCPM-V4.0开源:4B参数端侧流畅运行 同级多模性能SOTA
AI妹 1 个月前 9 0

 魔搭ModelScope社區宣佈,面壁小鋼炮新一代多模態模型MiniCPM-V4.0正式開源。憑藉4B參數量,該模型在OpenCompass、OCRBench、MathVista等多個

MiniCPM-V4.0开源:轻量多模态模型,移动端优化性能强生态完善
AI妹 1 个月前 7 0

 OpenBMB 团队近日宣布,新一代多模态大模型 MiniCPM-V4.0 正式开源发布。该模型凭借其轻量级架构和卓越性能,被誉为“手机上的 GPT-4V”,有望为移动设备上的 AI

MiniCPM-V4.0开源:轻量高性能多模态模型 开启手机AI应用新篇章
AI妹 1 个月前 8 0

 The OpenBMB team recently announced the official open-source release of the new multimodal l

小米开源多模态大模型MiMo-VL-7B-2508 含RL/SFT版本性能获多项突破
AI妹 1 个月前 7 0

Xiaomi's large model team announced the open source of the latest multimodal large model Xiaomi Mi

小米开源最新MiMo-VL-7B-2508多模态模型 含RL/SFT版四项核心能力刷新纪录
AI妹 1 个月前 9 0

小米大模型团队宣布开源最新一代多模态大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 与 SFT 两个版本。 官方数据显示,新版模型在学科推理、文档理解、图形界面定位及视频理解四

小米MiMo-VL-7B-2508多模态模型开源 双版本性能大提升
AI妹 1 个月前 8 0

小米のマルチモーダル大規模モデルチームは、最新のマルチモーダル大規模モデル「Xiaomi MiMo-VL-7B-2508」をオープンソース化したことを発表しました。このモデルにはRLとSFTの2つ

小米宣布开源最新一代多模态大模型MiMo-VL-7B-2508核心性能刷新纪录含双版本
AI妹 1 个月前 8 0

小米大模型團隊宣佈開源最新一代多模態大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 與 SFT 兩個版本。 官方數據顯示,新版模型在學科推理、文檔理解、圖形界面定位及視頻理解四

MiniCPM-V4.0视觉模型:OpenCompass高分 移动流畅 开源iOS应用易上手
AI妹 1 个月前 8 0

在人工智能的持續發展中,最近一款新模型 MiniCPM-V4.0引起了廣泛關注。該模型是 MiniCPM-V 系列的最新版本,具有4.1億參數,基於 SigLIP2-400M 和 MiniCPM4