关闭导航

包含标签"评估基准"的内容

阿里巴巴发布VACE模型 以革新架构统一处理多模态视频生成编辑任务
AI妹 1 个月前 9 0

アリババグループの科学者たちは、幅広い動画生成と編集タスクを統一的に処理することを目的とした汎用人工知能モデルであるVACEを発表しました。 VACEの中核は、強化された拡散Transforme

NVIDIA DAM-3B多模态模型:区域化描述突破 开源赋能多领域创新应用
AI妹 1 个月前 9 0

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模

清华腾讯联合发布RBench-V基准 评估多模态大模型视觉推理能力结果差距大
AI妹 1 个月前 8 0

近日,由清華大學、騰訊混元、斯坦福大學及卡耐基梅隆大學的研究團隊聯合發佈了一項新評估基準 ——RBench-V,專門針對多模態大模型的視覺推理能力進行測試。該基準的推出,旨在填補當前評估體系中對模

RBench-V基准发布 评估多模态大模型视觉推理能力表现欠佳
AI妹 1 个月前 6 0

最近、清華大学、テンセント・ミックスワン、スタンフォード大学、そしてカーネギーメロン大学の研究チームは、多モーダル大規模モデルの視覚推論能力をテストするための新しい評価ベンチマークである RBen

RBench-V基准发布 多模态大模型视觉推理能力评估结果揭晓
AI妹 1 个月前 9 0

近日,由清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队联合发布了一项新评估基准 ——RBench-V,专门针对多模态大模型的视觉推理能力进行测试。该基准的推出,旨在填补当前评估体系中对模