关闭导航

包含标签" HealthBench Hard"的内容

OpenAI发布HealthBench医疗大模型评估框架 262名医師参与多模型评估
AI妹 3 个月前 16 0

最近、OpenAIは、医療現場での大規模言語モデル(LLMs)のパフォーマンスと安全性を測定することを目的としたHealthBenchというオープンソース評価フレームワークを発表しました。このフレ

OpenAI推出HealthBench框架 评估医疗大模型真实场景表现
AI妹 3 个月前 16 0

Recently, OpenAI released a new open-source evaluation framework named HealthBench, aimed at measu

OpenAI正式发布GPT-5模型 多版本性能跃升安全升级迈向AGI
AI妹 3 个月前 14 0

At 1:00 AM Beijing Time today, the company OpenAI officially announced the launch of the GPT-5 mod

OpenAI发布GPT-5:技术升级、多版本定价及行业反响综述
AI妹 3 个月前 15 0

AIBase | August 8, 2025 report On August 7, 2025, OpenAI officially released its latest generat