关闭导航

包含标签"物理推理"的内容

北大联合多院系推出PHYBench物理推理评测基准 人机对决显人类优势
AI妹 1 个月前 9 0

最近,北京大學物理學院聯合多個院系,推出了一項名爲 “PHYBench” 的全新評測基準,旨在檢驗大模型在物理推理上的真實能力。該項目由朱華星老師和曹慶宏副院長主導,匯聚了來自物理學院和其他學科的

昆仑万维发布Skywork-R1V3.0开源多模态模型 MMMU评测领先闭源跨模态能力强
AI妹 1 个月前 9 0

近日,昆仑万维正式发布了其全新开源模型 Skywork-R1V3.0,宣称在多模态推理方面达到了前所未有的高度,甚至与人类初级专家的水平不相上下。该模型在训练过程中采用了强化学习策略,使得其在复杂

开源模型Skywork-R1V3.0多模态推理能力突出 MMMU得分领先闭源模型
AI妹 1 个月前 7 0

Recently, Kuaizhi Wanyi officially released its brand-new open-source model Skywork-R1V3.0, claimi