登录之后可以开启更多功能哦
最近、OpenAIは、医療現場での大規模言語モデル(LLMs)のパフォーマンスと安全性を測定することを目的としたHealthBenchというオープンソース評価フレームワークを発表しました。このフレ