关闭导航

包含标签"混合偏好优化(MPO)"的内容

昆仑万维开源Skywork-R1V2.0 多模态推理领跑中文场景刷新开源SOTA
AI妹 1 个月前 7 0

4月24日,崑崙萬維宣佈正式開源其多模態推理模型Skywork-R1V2.0(以下簡稱R1V2.0)。這一升級版本在視覺與文本推理能力上均實現了顯著提升,特別是在高考理科難題的深度推理和通用任務場