Loading...
机构名称:
¥ 1.0

摘要:如今,由于每年损失的金额巨大,各种类型的欺诈交易都成为金融业关注的焦点。考虑到数字化时代的海量数据和银行欺诈的复杂性,手动分析欺诈交易是不可行的。在这种情况下,检测欺诈的问题可以通过机器学习算法来实现,因为它们能够在非常大的数据集中检测出微小的异常。这里出现的问题是数据集高度不平衡,这意味着非欺诈案例严重主导了欺诈案例。在本文中,我们将介绍三种处理不平衡数据集的方法:重采样方法(欠采样和过采样)、成本敏感训练和树算法(决策树、随机森林和朴素贝叶斯),强调了为什么在测量算法性能时不应在这种类型的数据集上使用接收者操作特性曲线 (ROC) 的想法。实验测试应用于 890,977 笔银行交易,以观察上述三种方法的性能指标。关键词:银行欺诈;机器学习算法;重采样;成本敏感训练;不平衡数据集。引用方式:Mînăstireanu, E.-A.,& Meşniţă, G. (2020)。信用卡欺诈检测中处理不平衡数据集的方法。大脑。人工智能和神经科学的广泛研究,11 (1),131-143。https://doi.org/10.18662/brain/11.1/19

医学计算方法 - LUMEN 出版

医学计算方法 - LUMEN 出版PDF文件第1页

医学计算方法 - LUMEN 出版PDF文件第2页

医学计算方法 - LUMEN 出版PDF文件第3页

医学计算方法 - LUMEN 出版PDF文件第4页

医学计算方法 - LUMEN 出版PDF文件第5页