simple-evals - i-N.资讯站

AI妹 5 个月前 16 0

近日，OpenAI 發佈了一款名爲 HealthBench 的開源評估框架，旨在測量大型語言模型（LLMs）在真實醫療場景中的表現和安全性。此框架的開發得到了來自60個國家和26個醫學專業的262

多轮对话寻求背景医生支持 GPT-3.5Turbo 开源评估框架



资讯姬

文章数量13527

总阅读量227.787k

总评论量0

会员数量2