关闭导航

包含标签"视觉语言模型"的内容

Liquid AI发布LFM2.5小型多模态模型家族 赋能边缘高效智能应用
AI妹 13 天前 8 0

Liquid AI 最近推出了 LFM2.5,这是一个新一代的小型基础模型家族,基于 LFM2架构,专注于边缘设备和本地部署。该模型家族包括 LFM2.5-1.2B-Base 和 LFM2.5-1

字节跳动开源UI-TARS-1.5 多模态代理在GUI及游戏领域创SOTA佳绩
AI妹 1 个月前 10 0

バイトダンスのDoubao大規模言語モデルチームは、視覚言語モデルに基づいたオープンソースのマルチモーダルエージェントであるUI-TARS-1.5のオープンソース化を発表しました。これは、仮想世界

字节跳动开源UI-TARS-1.5多模态智能体 跨GUI与游戏任务获SOTA并展长程推理
AI妹 1 个月前 10 0

ByteDance's Doubao large model team announced the open-source release of UI-TARS-1.5, a multi-moda

字节跳动发布UI-TARS-1.5开源多模态代理,智能跨平台GUI自动化兼具自我优化
AI妹 1 个月前 9 0

字节跳动在Hugging Face平台正式发布了UI-TARS-1.5,一款基于强大视觉语言模型构建的开源多模态代理。这一发布标志着字节跳动在AI自动化交互领域的又一重大突破,为开发者与用户提供了

字节跳动开源UI-TARS-1.5 多模态代理助力跨平台GUI自动化
AI妹 1 个月前 10 0

バイトダンスはHugging Faceプラットフォーム上で、強力なビジョン言語モデルに基づいて構築されたオープンソースのマルチモーダルエージェントであるUI-TARS-1.5を正式にリリースしまし

苹果发布FastVLM:高分辨率优化新视觉语言模型 移动端高效运行提速85倍
AI妹 1 个月前 13 0

苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。FastVLM通过创新的FastViTHD视觉

苹果发布FastVLM高效模型:高分辨率视觉语言处理快85倍且性能优异
AI妹 1 个月前 8 0

苹果最近又搞了个大新闻,偷偷摸摸地发布了一个叫 FastVLM 的模型。听名字可能有点懵,但简单来说,这玩意儿就是让你的 iPhone 瞬间拥有了“火眼金睛”,不仅能看懂图片里的各种复杂信息,还能

3D-R1模型:合成数据集等创新提升3D场景理解推理泛化能力,成效显著
AI妹 1 个月前 9 0

 In the field of artificial intelligence, vision-language models (VLMs) have made significant

新規3D視覚言語モデル3D-R1の技術創新と性能向上成果が発表される
AI妹 1 个月前 10 0

 人工知能分野において、視覚言語モデル(VLM)は近年顕著な進展を遂げており、特に2次元の視覚理解においては大きな成果を収めています。この分野がさらに発展するにつれて、研究者たちは3Dシ

澳大利亚AEHRC用VLM模型 辅助胸部X光分析减轻医生负担提升报告准确性
AI妹 1 个月前 9 0

随着人工智能(AI)技术的不断发展,越来越多的澳大利亚人开始在日常生活中使用 AI。CSIRO(联邦科学与工业研究组织)下属的澳大利亚电子健康研究中心(AEHRC)正在积极探索如何将 AI 应用于

    1 2