近日,IBM正式发布了全新的视觉语言模型Granite 4.0 3B Vision。这款模型拥有 30 亿参数,专门针对企业级复杂文档的数据提取任务进行了深度优化,旨在解决金融、法律及医疗等行业在
3D 打印技术虽然革新了制造业,但由于大多数设备采用“开环系统”,极其微小的参数波动都可能导致打印失败。近日,卡内基梅隆大学机械工程系副教授 Amir Barati Farimani 团队开发出一
近日,AI学术界与产业界传来重磅消息,MLNLP学术委员、资深研究员庞天宇正式宣布加入腾讯混元(Tencent Hunyuan),出任首席研究科学家及多模态强化学习(Multimoda
Liquid AI 最近推出了 LFM2.5,这是一个新一代的小型基础模型家族,基于 LFM2架构,专注于边缘设备和本地部署。该模型家族包括 LFM2.5-1.2B-Base 和 LFM2.5-1
バイトダンスのDoubao大規模言語モデルチームは、視覚言語モデルに基づいたオープンソースのマルチモーダルエージェントであるUI-TARS-1.5のオープンソース化を発表しました。これは、仮想世界
ByteDance's Doubao large model team announced the open-source release of UI-TARS-1.5, a multi-moda
字节跳动在Hugging Face平台正式发布了UI-TARS-1.5,一款基于强大视觉语言模型构建的开源多模态代理。这一发布标志着字节跳动在AI自动化交互领域的又一重大突破,为开发者与用户提供了
バイトダンスはHugging Faceプラットフォーム上で、強力なビジョン言語モデルに基づいて構築されたオープンソースのマルチモーダルエージェントであるUI-TARS-1.5を正式にリリースしまし
苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。FastVLM通过创新的FastViTHD视觉
苹果最近又搞了个大新闻,偷偷摸摸地发布了一个叫 FastVLM 的模型。听名字可能有点懵,但简单来说,这玩意儿就是让你的 iPhone 瞬间拥有了“火眼金睛”,不仅能看懂图片里的各种复杂信息,还能