Partiskhet i AI-benchmarking – studie anklagar LM Arena för att gynna teknikjättar
最近发表的研究排行榜幻觉(https://arxiv.org/pdf/2504.20879),已引起人们对LM Arena偏见的严重问题的关注点,该平台用于比较和排名不同的AI模型。该研究是Cohere Labs,Stanford,MIT和其他几个机构的研究人员之间的合作。结果引发了有关AI开发中透明和正义的问题。 AI基准研究中的帖子偏见指责LM竞技场首次出现在AI新闻中。