关闭导航

包含标签"代码生成任务"的内容

Agent-as-a-Judge智能评估项目:省时省成本 获ICML2025认可 成功应用于代码生成
AI妹 1 个月前 7 0

在当前人工智能的迅猛发展中,评估智能代理的能力成为了一个重要课题。为此,Agent-as-a-Judge(代理法官)项目应运而生,它不仅是一个技术库,更是一种全新的评估理念。该项目旨在通过智能代理

Agent-as-a-Judge智能评估项目:高效省成本 获ICML2025学术认可
AI妹 1 个月前 8 0

在當前人工智能的迅猛發展中,評估智能代理的能力成爲了一個重要課題。爲此,Agent-as-a-Judge(代理法官)項目應運而生,它不僅是一個技術庫,更是一種全新的評估理念。該項目旨在通過智能代理

西湖大学团队提出扩散式发散思维链 提升扩散语言模型推理能力
AI妹 1 个月前 9 0

在近年来的人工智能研究中,思维链的概念越来越受到重视,尤其是在大型语言模型的训练和推理中。最近,西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”,这是一种为扩

DeepSeek R1-0528发布:128K上下文+强推理编码,免费开放引行业关注
AI妹 1 个月前 8 0

As a pioneer in the AI field, DeepSeek once again sparked industry discussions with its technologi