关闭导航

包含标签"VLM"的内容

CameraBench:赋能AI精准理解镜头运动的创新研究成果
AI妹 1 个月前 11 0

咱们天天聊 AI 多牛逼,能写诗、能画画、还能跟你唠嗑到天亮。但你有没有想过,当 AI 看视频的时候,它真的“看懂”了吗? 你可能会说:“当然了,都能识别猫猫狗狗、人山人海了!” 打住!识别物

AI镜头运动理解有新招!CameraBench数据集显威力
AI妹 1 个月前 9 0

咱們天天聊 AI 多牛逼,能寫詩、能畫畫、還能跟你嘮嗑到天亮。但你有沒有想過,當 AI 看視頻的時候,它真的“看懂”了嗎? 你可能會說:“當然了,都能識別貓貓狗狗、人山人海了!” 打住!識別物

苹果发布FastVLM:高分辨率优化新视觉语言模型 移动端高效运行提速85倍
AI妹 1 个月前 13 0

苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。FastVLM通过创新的FastViTHD视觉

新規3D視覚言語モデル3D-R1の技術創新と性能向上成果が発表される
AI妹 1 个月前 10 0

 人工知能分野において、視覚言語モデル(VLM)は近年顕著な進展を遂げており、特に2次元の視覚理解においては大きな成果を収めています。この分野がさらに発展するにつれて、研究者たちは3Dシ

腾讯AI Lab开源Cognitive Kernel-Pro框架 减依赖GAIA测试优SmolAgents近付费工具
AI妹 1 个月前 13 0

大規模言語モデル(LLM)や視覚-言語モデル(VLM)の急速な発展に伴い、エージェントは知識の発見や問題解決の方法において革命的な変化を遂げています。しかし、多くの既存のオープンソースエージェント

澳大利亚AEHRC用VLM模型 辅助胸部X光分析减轻医生负担提升报告准确性
AI妹 1 个月前 8 0

随着人工智能(AI)技术的不断发展,越来越多的澳大利亚人开始在日常生活中使用 AI。CSIRO(联邦科学与工业研究组织)下属的澳大利亚电子健康研究中心(AEHRC)正在积极探索如何将 AI 应用于

字节跳动发布70亿参数开源多模态模型BAGEL 性能超主流VLM生成能力强
AI妹 1 个月前 10 0

字節跳動は最近、最新のオープンソース多モーダル基礎モデルである「BAGEL(Big Advanced Generalized Embodied Learner)」を正式に発表しました。70億個の有