衡量美国政治暴力:语言模型实验

另一天,另一个出于政治动机的攻击。今天早上在达拉斯冰拘留所开枪射击 - 一名狙击手杀死了两名被拘留者并受伤了,然后又促使我生命促使我重新审视了一个困扰我的问题:美国实际上是在美国的政治暴力在增加,还是只是[…]

来源:市场货币主义者

另一天,另一个出于政治动机的攻击。

今天早上在达拉斯冰拘留所进行的枪击事件 - 狙击手杀死了两名被拘留者并受伤了另一名拘留所,然后促使我自己生命促使我重新审视了一个困扰我的问题:在美国实际上是在增加政治暴力,还是只是那样?

为了探索这一点,我已经进行了我所说的方法学实验。

我不再依靠传统数据集,而是使用Chatgpt和Claude自1945年以来在美国建立了政治暴力的综合指数。让我绝对清楚:这不是常规数据。它是通过语言模型生成的数据,具有所有暗示的局限性。

方法(及其局限性)

这是我所做的:我要求Chatgpt和Claude生成自1945年以来出于政治动机的暴力事件的清单,然后让他们在50个规模上对每个事件的严重性进行评分,其中50个代表“正常”水平。

模型评估了伤亡和象征意义,我用它们互相检查彼此的工作。然后,我自己对产出进行了质量检查,并通过明确确定的政治隶属关系对肇事者进行了分类。

这种方法是非正统的。语言模型对现有文本进行了培训,并可能反映其培训数据中的偏见。他们可能会超重高度宣传的事件或最近在培训语料库中突出特征的事件。

我们正在查看的“数据”本质上是这些模型吸收美国政治暴力的结构化综合。

但是这里有一些有趣的东西。这些模型已经处理了有关政治暴力的大量信息 - 新闻报道,学术研究,政府文件。他们的输出可能会捕获传统数据集错过的模式,尽管它也可能会扩大某些叙述或盲点。

合成数据显示的内容

查理·柯克暗杀和最新模式