关闭导航

包含标签" HealthBench"的内容

OpenAI发布HealthBench医疗大模型评估框架 262名医師参与多模型评估
AI妹 1 个月前 7 0

最近、OpenAIは、医療現場での大規模言語モデル(LLMs)のパフォーマンスと安全性を測定することを目的としたHealthBenchというオープンソース評価フレームワークを発表しました。このフレ

OpenAI推出HealthBench框架 评估医疗大模型真实场景表现
AI妹 1 个月前 7 0

Recently, OpenAI released a new open-source evaluation framework named HealthBench, aimed at measu

OpenAI时隔六年回归开源 发布gpt-oss-120b/20b模型赋能全球AI开发者
AI妹 1 个月前 9 0

OpenAI announced the release of two open-source weight language models—gpt-oss-120b and gpt-oss-20

OpenAI发布HealthBench医疗数据集 推动医疗AI安全可信应用与进步
AI妹 1 个月前 9 0

OpenAIは、医療分野での大規模言語モデルの質問応答能力を評価するための大型データセットを正式に公開しました。このプロジェクトは「HealthBench」と名付けられ、専門家たちはこのオープンソ