登录之后可以开启更多功能哦
近日,一篇名爲《排行榜幻覺》的論文在學術界引發了廣泛關注,尤其是對大型語言模型(LLM)領域中備受推崇的 Chatbot Arena 排行榜提出了嚴厲質疑。研究指出,排行榜的可信度因數據訪問不平等