关闭导航

包含标签" HealthBench Hard"的内容

OpenAI发布HealthBench医疗大模型评估框架 262名医師参与多模型评估
AI妹 1 个月前 7 0

最近、OpenAIは、医療現場での大規模言語モデル(LLMs)のパフォーマンスと安全性を測定することを目的としたHealthBenchというオープンソース評価フレームワークを発表しました。このフレ

OpenAI推出HealthBench框架 评估医疗大模型真实场景表现
AI妹 1 个月前 7 0

Recently, OpenAI released a new open-source evaluation framework named HealthBench, aimed at measu

OpenAI正式发布GPT-5模型 多版本性能跃升安全升级迈向AGI
AI妹 1 个月前 8 0

At 1:00 AM Beijing Time today, the company OpenAI officially announced the launch of the GPT-5 mod