关闭导航

包含标签"视觉问答"的内容

Meta推出WebSSL纯视觉自监督模型 无语言监督性能优异展潜力
AI妹 1 个月前 9 0

在人工智能領域,Meta 公司最近推出了 WebSSL 系列模型,這一系列模型的參數規模從3億到70億不等,基於純圖像數據進行訓練,旨在探索無語言監督的視覺自監督學習(SSL)的巨大潛力。這一新研

首个IDP Leaderboard基准正式发布 主流模型智能文档处理能力全面评估
AI妹 1 个月前 10 0

5月11日,智能文檔處理領域迎來重大進展——首個針對視覺-語言模型的統一基準測試"IDP Leaderboard"正式推出。該基準通過16個數據集、9229份文檔,全面評估了當前主流模型在OCR、

首个视觉语言模型统一基准IDP Leaderboard发布 评估多模型揭示文档处理挑战
AI妹 1 个月前 11 0

5月11日,智能文档处理领域迎来重大进展——首个针对视觉-语言模型的统一基准测试"IDP Leaderboard"正式推出。该基准通过16个数据集、9229份文档,全面评估了当前主流模型在OCR、

SmolVLM多模态模型利用WebGPU实现浏览器实时摄像头本地化推理突破
AI妹 1 个月前 10 0

Hugging Face推出的SmolVLM多模態模型迎來重大突破:通過WebGPU技術,SmolVLM現可在瀏覽器中實現實時網絡攝像頭圖像識別,無需服務器支持,全部計算在用戶設備上完成。這一創新

SmolVLM依托WebGPU实现浏览器摄像头实时本地推理 隐私有保障
AI妹 1 个月前 9 0

A major breakthrough has been achieved by SmolVLM, a multimodal model introduced by Hugging Face:

Salesforce BLIP3-o全开源多模态模型Hugging Face发布 技术突破引行业热议
AI妹 1 个月前 8 0

Salesforce AI Research在Hugging Face平臺正式發佈BLIP3-o應用,這款全開源的統一多模態模型家族以其卓越的圖像理解與生成能力引發業界熱議。BLIP3-o通過創新

Salesforce BLIP3-o全开源统一多模态模型Hugging Face发布引业界热议
AI妹 1 个月前 8 0

Salesforce AI Research在Hugging Face平台正式发布BLIP3-o应用,这款全开源的统一多模态模型家族以其卓越的图像理解与生成能力引发业界热议。BLIP3-o通过创新

Salesforce BLIP3-o全开源统一多模态模型于Hugging Face平台正式发布
AI妹 1 个月前 9 0

Salesforce AI Research has officially released BLIP3-o on the Hugging Face platform, a fully open-

Meta携手港中文推出Multi-SpatialMLLM模型 大幅提升空间理解能力
AI妹 1 个月前 7 0

科技巨頭 Meta 與香港中文大學的研究團隊聯合推出了 Multi-SpatialMLLM 模型,這一新框架在多模態大語言模型(MLLMs)的發展中取得了顯著進展,尤其是在空間理解方面。該模型通過

谷歌公布新AI眼镜路线图 2026年推无屏及显示版Gemini产品并与三星等合作
AI妹 1 个月前 12 0

12月8日,谷歌在“The Android Show: XR Edition”正式公布AI眼镜路线图,将与三星、Gentle Monster、Warby Parker联手推出两款设备:①无屏辅助A

    1 2