构建事实检查系统:在传播之前捕获重复的虚假主张

在数字世界中,检索方法和集合方法如何使事实核对速度更快,可扩展和更可靠,构建事实检验系统:在首先迈向数据科学之前,捕获重复的虚假主张。

来源:走向数据科学

:为什么我们需要自动事实检查

与传统媒体相比,在发表之前对文章进行了编辑和验证,社交媒体完全改变了方法。突然,每个人都可以发出声音。立即共享帖子,从而使世界各地的思想和观点获得访问权。至少那是梦想。

最初是一种保护言论自由的想法,使个人有机会在没有审查的情况下表达意见,这取决于权衡。很少检查信息。这使得比以往任何时候都更难检测什么是准确的,什么不是。

一个额外的挑战将被创造,因为错误主张很少出现一次。它们通常在不同的平台上重新保存,通常会改变措辞,格式,长度甚至语言,从而使检测和验证变得更加困难。随着这些变化在平台上流通,它们似乎很熟悉,因此对其读者来说是可信的。

开放,未经审查和可靠信息的空间的最初想法已陷入悖论。旨在赋予人们权力的开放性也使错误信息传播变得容易。这正是事实检查系统所在的地方。

事实检查管道的发展

传统上,事实检查是一个手动过程,它依靠专家(记者,研究人员或事实检查组织)来验证索赔,通过向官方文件或专家意见等来源提及索赔来验证索赔。这种方法非常可靠和彻底,但也非常耗时。因此,这种延迟的结果是虚假叙事流通,塑造公众舆论并实现进一步操纵的结果。

  • 主张检测 - 找到具有事实影响的陈述。
  • 主张优先级 - 按利差,潜在伤害或公共利益的速度对他们进行排名,以优先考虑最有影响力的案件。
  • 检索证据 - 收集支持材料并提供对其进行评估的背景。
  • k 检索