关闭导航

包含标签"模型性能排行榜"的内容

LMArena陷信任危机 研究指排名偏袒大厂 平台否认相关指控
AI妹 1 个月前 10 0

 人工智能领域知名的公共基准测试平台LMArena近日遭遇信任危机。一项新的研究指出,该平台的排名系统存在偏袒OpenAI、谷歌和Meta等大型供应商的结构性问题,其不透明的流程和头部企