Kolmogorov – Smirnov统计量,解释:测量信用风险建模中的模型功率

了解银行如何在贷款批准中使用KS统计数据。科尔莫格罗夫– Smirnov统计量,解释:衡量信用风险建模中的模型功率首先出现在数据科学上。

来源:走向数据科学

日子,人们比以往任何时候都多。对于想要建造自己的房屋的任何人,可以提供房屋贷款,如果您拥有财产,则可以获得财产贷款。还有农业贷款,教育贷款,商业贷款,黄金贷款等。

除此之外,对于购买电视,冰箱,家具和手机等物品,我们还提供EMI选项。

但是每个人都批准了他们的贷款申请吗?

银行不会向申请的每个人贷款;他们有一个过程批准贷款。

我们知道机器学习和数据科学现在已在各个行业中应用,银行也利用它们。

当客户申请贷款时,银行需要知道客户按时偿还的可能性。

为此,银行使用预测模型,主要基于逻辑回归或其他机器学习方法,

我们已经知道,通过应用这些方法,每个申请人都被分配了概率。

这是一个分类模型,我们需要对违约者和非债券进行分类。

违约者:未能偿还贷款的客户(错过付款或完全停止付款)。

defaulters

非债务人:按时偿还贷款的客户。

非defaulters

我们已经讨论了评估分类模型的准确性和ROC-AUC。

讨论了准确性和ROC-AUC

在本文中,我们将讨论Kolmogorov-Smirnov统计量(KS统计量),该统计数据用于评估分类模型,尤其是在银行业中。

Kolmogorov-Smirnov统计(KS统计)

要了解KS统计数据,我们将使用德国信用数据集。

此数据集包含有关1000个贷款申请人的信息,通过20个功能来描述,例如帐户状态,贷款持续时间,信用额,就业,住房和个人身份等。

目标变量指示申请人是非defaulter(由1)还是Defaulter(由2表示)。

您可以在此处找到有关数据集的信息。

在这里

代码:

\ [

\] \ [

\]