如何从逻辑回归模型构建信用评分网格

将模型系数转换为 0-1000 分,并进行风险类别和稳定性检查如何从 Logistic 回归模型构建信用评分网格一文首先出现在 Towards Data Science 上。

来源:走向数据科学

本文中使用的所有代码均可在 GitHub 上获取。业务逻辑和建模功能位于src/selection目录中,具体在以下文件中:

src/modeling/score_computation.py

相应的分析和结果记录在:

09_score_computation.qmd

图像、表格和图表是在 Codex 编码助手的帮助下生成的。

,您的信用评分无处不在。它决定你是否获得贷款、信用卡,甚至公寓。大多数这些决策背后的模型是 FICO。一旦你分解它,它的逻辑就很简单。

FICO 衡量五件事:

  • 付款历史 (35%):按时支付账单。
  • 欠款 (30%):将您的信用使用率控制在 20% 以下。
  • 历史长度(15%):越长越好。
  • 信贷组合 (10%):使用不同类型的信贷。
  • 新信贷 (10%):限制新申请。
  • 如果您按时支付信用卡账单,您的分数就会上升。付款历史记录最重要。

    这些权重产生一个分数,分为多个范围:

  • 300–579:差。
  • 580–669:一般。
  • 670–739:很好。
  • 740–799:非常好。
  • 800–850:非常好。
  • 本文遵循相同的逻辑,但将其应用于我们自己的模型。

    我们使用本系列的数据集来构建评分模型。目标很简单:为每个保留变量赋予权重,计算数据中每个客户的分数,并显示如何计算新客户的分数。

    和以前一样,Codex 帮助编写代码并构建表格和图表。我一直这么说是因为这很重要:你可以使用人工智能代理来加快你的工作速度。但检查他们的输出。只有当你验证它时,信任才会增长。使用这些工具,但保持警惕。

    让我们回忆一下上次发现的内容。我们保留了四个变量:

  • Loan_int_rate:贷款利率。
  • Loan_percent_venue:用于支付贷款的收入比例。
  • cb_person_default_on_file:借款人之前是否违约。
  • home_ownership_3:借款人的住房状况。
  • 从模型系数到分数

    我们将每个系数转化为分数。

    变量每个类别的得分

    [1]