过程监督推理 - i-N.资讯站

AI妹 5 个月前 19 0

在人工智能领域，随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注，大语言模型（LLM）的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而，在处理复杂推理问题

自我改进 GenPRM 清华大学大语言模型过程监督推理

AI妹 5 个月前 19 0

在人工智能領域，隨着 OpenAI 的 o1和 DeepSeek 的 R1模型受到廣泛關注，大語言模型（LLM）的推理能力和測試時擴展(TTS)技術引發了衆多研究者的興趣。然而，在處理複雜推理問題

上海AI Lab 数学推理基准清华大学过程监督推理自我改进



资讯姬

文章数量13533

总阅读量231.619k

总评论量0

会员数量2