评估基准 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"评估基准"的内容

阿里巴巴发布VACE模型以革新架构统一处理多模态视频生成编辑任务

阿里巴巴发布VACE模型以革新架构统一处理多模态视频生成编辑任务

AI妹 5 个月前 16 0

アリババグループの科学者たちは、幅広い動画生成と編集タスクを統一的に処理することを目的とした汎用人工知能モデルであるVACEを発表しました。 VACEの中核は、強化された拡散Transforme

视频条件单元(VCU) 强化扩散Transformer架构视频编辑概念分离技术视频生成

查看详情

NVIDIA DAM-3B多模态模型：区域化描述突破开源赋能多领域创新应用

NVIDIA DAM-3B多模态模型：区域化描述突破开源赋能多领域创新应用

AI妹 5 个月前 19 0

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B（DAM-3B），专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能，在多模

多模态大语言模型 Describe Anything3B 无障碍技术焦点提示 Gated Cross-Attention

查看详情

清华腾讯联合发布RBench-V基准评估多模态大模型视觉推理能力结果差距大

清华腾讯联合发布RBench-V基准评估多模态大模型视觉推理能力结果差距大

AI妹 5 个月前 18 0

近日，由清華大學、騰訊混元、斯坦福大學及卡耐基梅隆大學的研究團隊聯合發佈了一項新評估基準 ——RBench-V，專門針對多模態大模型的視覺推理能力進行測試。該基準的推出，旨在填補當前評估體系中對模

图像生成视觉推理能力评估基准智能體推理 o3模型

查看详情

RBench-V基准发布评估多模态大模型视觉推理能力表现欠佳

RBench-V基准发布评估多模态大模型视觉推理能力表现欠佳

AI妹 5 个月前 17 0

最近、清華大学、テンセント・ミックスワン、スタンフォード大学、そしてカーネギーメロン大学の研究チームは、多モーダル大規模モデルの視覚推論能力をテストするための新しい評価ベンチマークである RBen

Gemini2.5 腾讯MixOne 智能代理推理电磁学代数抽象

查看详情

RBench-V基准发布多模态大模型视觉推理能力评估结果揭晓

RBench-V基准发布多模态大模型视觉推理能力评估结果揭晓

AI妹 5 个月前 15 0

近日，由清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队联合发布了一项新评估基准 ——RBench-V，专门针对多模态大模型的视觉推理能力进行测试。该基准的推出，旨在填补当前评估体系中对模

RBench-V 腾讯混元几何与图论 Google Gemini2.5模型 o3模型

查看详情



资讯姬

文章数量13547

总阅读量240.186k

总评论量0

会员数量2

本站由emlog驱动