关闭导航

包含标签"医生验证"的内容

OpenAI发布HealthBench框架 评估医疗LLM真实场景表现与安全性
AI妹 1 个月前 8 0

近日,OpenAI 发布了一款名为 HealthBench 的开源评估框架,旨在测量大型语言模型(LLMs)在真实医疗场景中的表现和安全性。此框架的开发得到了来自60个国家和26个医学专业的262