关闭导航

包含标签"过程监督推理"的内容

清华上海AI Lab提出GenPRM 大幅提升大模型过程监督推理能力
AI妹 1 个月前 9 0

在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题

清华上海AI Lab提出GenPRM 少样本高效显著提升大模型推理过程监督能力
AI妹 1 个月前 10 0

在人工智能領域,隨着 OpenAI 的 o1和 DeepSeek 的 R1模型受到廣泛關注,大語言模型(LLM)的推理能力和測試時擴展(TTS)技術引發了衆多研究者的興趣。然而,在處理複雜推理問題