关闭导航

包含标签"评估数据集"的内容

B站开源AniSora动漫视频生成模型 填补领域空白性能达SOTA
AI妹 1 个月前 9 0

Recently, the Bilibili (shortened as B站) team officially open-sourced a new anime video generation

OpenAI发布HealthBench医疗评估数据集 首次独立探索医疗领域
AI妹 1 个月前 9 0

OpenAI 正式发布了一个大型数据集,旨在评估大型语言模型在医疗健康领域回答问题的能力。这一项目被命名为 HealthBench,专家们对这一开源数据和详细的评估标准给予了高度赞誉,称其在规模和

OpenAI发布HealthBench医疗数据集 首次独立探索医疗AI评估领域
AI妹 1 个月前 8 0

OpenAI 正式發佈了一個大型數據集,旨在評估大型語言模型在醫療健康領域回答問題的能力。這一項目被命名爲 HealthBench,專家們對這一開源數據和詳細的評估標準給予了高度讚譽,稱其在規模和