使用事实检查网站Politifact收集社交媒体用户资料和新闻文章的稳健标签数据集。这是培训和测试模型的基础真理数据。从用户配置文件和新闻内容中提取一系列功能,这些功能可能可能向不可靠性发出信号。其中包括文章,用户元数据(例如关注者数量)以及围绕用户之间的新闻传播的上下文。功能工程将原始数据转换为模型的信息输入。开发一个深层的神经网络体系结构,该体系结构可以仅根据工程功能将用户配置文件准确地将用户配置文件分类为可靠或不可靠。对SVM和KNN分类器的性能是基准的。基于地面真相标签,目标的精度超过90%。创建一个预测模型的变体,该变体还基于类似新闻文章的传播模式,还包括用户之间影响的信号。这探讨了对他人影响的迹象是否改善了散布错误的检测。
主要关键词