科学家开发出新的假新闻检测系统

麻省理工学院研究人员的新工作提出了一个用于自动检测虚假信息的统一系统,揭示了机器学习模型捕捉真实和虚假信息语言中微妙但明显的差异的能力。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

麻省理工学院研究人员的新工作提出了一个用于自动检测虚假信息的统一系统,揭示了机器学习模型捕捉真实和虚假信息语言中微妙但明显的差异的能力。

该研究还强调,假新闻检测器需要经过更严格的测试才能在现实环境中发挥作用。

虚假新闻是一种旨在误导读者的宣传形式,目的是在网站上产生某种观点或操纵舆论。

在这个问题变得非常重要之后,研究人员开始开发自动假新闻检测器 - 所谓的神经网络,它从各种数据中“学习”以识别指示虚假文章的语言信号。如果要评估新文章,这些神经网络可以在受控条件下以相当高的准确度将事实与虚构分开。

正在研究的模型是一个卷积神经网络,在假新闻和真实新闻的数据库上进行训练。为了进行训练和测试,研究人员使用了一种名为 Kaggle 的流行假新闻研究工具包,其中包含来自 244 个不同网站的约 12,000 条假新闻。他们还使用《纽约时报》的 2,000 多篇文章和《卫报》的 9,000 多篇文章编制了一组真实新闻样本。

研究人员首先使用相同的主题以传统方式训练和测试模型。但他们认为这可能会在模型中产生偏差,因为某些主题更有可能是假新闻或真实新闻的主题。例如,假新闻通常包含“特朗普”和“克林顿”等词。