摘要 - 欺诈检测在现代银行业中起着至关重要的作用,旨在减轻影响个人和金融机构的财务损失。经常使用信用卡的人口中有很大一部分人口,提高财务包容性的努力导致了卡的使用量增加。此外,电子商务的兴起带来了信用卡欺诈事件的激增。不幸的是,用于识别信用卡欺诈的传统统计方法很耗时,可能无法提供准确的结果。因此,机器学习算法已被广泛采用,以进行有效的信用卡欺诈检测。本研究通过采用三种抽样策略来应对不平衡的信用卡数据集的挑战:基于集群的多数股票下采样技术(CCMUT),合成少数民族过度采样技术(SMOTE)和过度采样技术。然后使用训练数据集训练九种机器学习算法,包括随机森林(RF),K最近的邻居(KNN),决策树(DT),逻辑回归(LR),ADA-BOOST,ADA-BOOST,EXTREES,MLP,MLP分类器,天真的贝叶斯和梯度增强的Boosting Classifier。使用准确性,精度,召回,F1分数和F2分数等指标评估这些方法的性能。本研究中使用的数据集是从Kaggle数据存储库中获得的。
主要关键词