登录之后可以开启更多功能哦
OpenAI 正式發佈了一個大型數據集,旨在評估大型語言模型在醫療健康領域回答問題的能力。這一項目被命名爲 HealthBench,專家們對這一開源數據和詳細的評估標準給予了高度讚譽,稱其在規模和