HealthBench Consensus - i-N.资讯站

AI妹 5 个月前 19 0

最近、OpenAIは、医療現場での大規模言語モデル（LLMs）のパフォーマンスと安全性を測定することを目的としたHealthBenchというオープンソース評価フレームワークを発表しました。このフレ

医疗AI评估基准临床交互 262名医生大语言模型 OpenAI

AI妹 5 个月前 19 0

Recently, OpenAI released a new open-source evaluation framework named HealthBench, aimed at measu



资讯姬

文章数量13530

总阅读量230.878k

总评论量0

会员数量2