关闭导航

包含标签"数据访问不平等"的内容

《排行榜幻觉》论文质疑Chatbot Arena可信度,直指数据不公、私下测试等问题。
AI妹 1 个月前 8 0

近日,一篇名爲《排行榜幻覺》的論文在學術界引發了廣泛關注,尤其是對大型語言模型(LLM)領域中備受推崇的 Chatbot Arena 排行榜提出了嚴厲質疑。研究指出,排行榜的可信度因數據訪問不平等