登录之后可以开启更多功能哦
最近、OpenAIは、医療現場での大規模言語モデル(LLMs)のパフォーマンスと安全性を測定することを目的としたHealthBenchというオープンソース評価フレームワークを発表しました。このフレ
Recently, OpenAI released a new open-source evaluation framework named HealthBench, aimed at measu