Loading...
机构名称:
¥ 1.0

摘要。银行贷款违约是可能影响银行业务的重要问题之一。为了避免这样的问题,银行需要分析大量数据,因此机器学习(ML)用于帮助做出准确的贷款批准决策。但是,在任何数据集中,贷款违约的存在都很小,这可能导致阶级失衡和预测偏见。另一个问题是存在可能导致预测模型的无关变量。因此,本研究的目的是通过将机器学习分类器与功能工程和数据集进行重新采样来克服这两个问题,以产生准确的预测。因此,本研究评估了四个机器学习分类器的性能,即K-Nearest邻居(KNN),逻辑回归(LR),决策树(DT)和随机森林(RF),在贷款俱乐部的公共默认贷款数据集上。应用数据预处理后,提出的方法使用该功能工程来根据特征相关性消除无关的功能。然后,将自适应合成抽样(ADASYN)应用于管理类别问题。实验结果表明了模型过度拟合问题的严重性,因为四个模型在功能工程和ADASYN方面的表现更好,并且准确性的显着增强。在这四个模型中,增强的RF模型在准确性,精度,灵敏度,特异性,F1分数和AUC方面,分别为0.95、0.97、0.96、0.8、0.94和0.88。关键字:银行贷款批准,贷款默认,机器学习算法,预测模型,类不平衡,功能工程

使用机器学习的贷款默认预测模型...

使用机器学习的贷款默认预测模型...PDF文件第1页

使用机器学习的贷款默认预测模型...PDF文件第2页

使用机器学习的贷款默认预测模型...PDF文件第3页

使用机器学习的贷款默认预测模型...PDF文件第4页

使用机器学习的贷款默认预测模型...PDF文件第5页

相关文件推荐