这项研究的主要目的是评估信用卡欺诈检测领域机器学习算法的性能,然后根据各种性能指标对其进行比较。使用了七种不同的监督分类算法,包括逻辑回归,决策树,随机森林,Xgboost,幼稚的贝叶斯,K-Nearest邻居和支持向量机。这些算法的性能是通过对指标的全面评估来衡量的,包括准确性,精度,召回,F-SCORE,AUC和AUPRC值。此外,还使用ROC曲线和混淆矩阵来评估这些算法。数据制备阶段在这项研究中至关重要。数据不平衡问题是欺诈和非欺诈交易之间不平等的分布。解决这种不平衡对于成功的模型培训和随后的可靠结果至关重要。采用了各种技术,例如缩放和分布,随机的下采样,降低性降低和聚类,以确保对模型性能的准确评估及其有效概括的能力。结果,“随机森林”和“ K-Neartheard Neighbors”算法在这项研究中表现出最高的性能水平,精度率为97%。这项研究对正在进行的与财务欺诈的斗争做出了重大贡献,并为未来的研究工作提供了宝贵的指导。