关闭导航

包含标签"基于执行的评估流程"的内容

AWS推出SWE-PolyBench多语言AI编程助手全面评估基准
AI妹 1 个月前 10 0

近日,AWS AI Labs 推出了 SWE-PolyBench,這是一個多語言的開源基準,旨在爲 AI 編程助手的評估提供一個更全面的框架。隨着大規模語言模型(LLM)的進步,AI 編程助手的開