关闭导航

包含标签"视觉感知能力"的内容

微软开源Phi-4视觉推理模型 兼具高分辨率视觉与深度推理能力
AI妹 1 个月前 2 0

微软近日在其开发者社区发布了一款名为 Phi-4-Reasoning-Vision-15B 的新型开源 AI 模型。这款模型不仅具备高分辨率的视觉感知能力,还能够进行深度推理,标志着 Phi-4

商汤与南洋理工联合开源NEO多模态模型 性能效率通用性全面突破
AI妹 4 个月前 21 0

商汤科技与南洋理工大学S-Lab联合发布并开源全新多模态模型架构NEO,通过底层架构创新实现视觉与语言的深层统一,在性能、效率和通用性上取得全面突破。 极致数据效率:1/10数据量达顶尖性能