数据的采矿规则

使用决策树快速分割数据,从数据挖掘规则首先出现在数据科学方面。

来源:走向数据科学

使用产品,我们可能需要引入一些“规则”。让我在实际示例中解释一下“规则”的含义:

    想象一下,我们的产品中看到了大量的欺诈浪潮,并且我们希望限制特定客户的登机,以降低这种风险。例如,我们发现大多数欺诈者都有来自某些国家 /地区的特定用户代理和IP地址。 另一种选择是向客户发送优惠券,以便在我们的在线商店中使用。但是,我们只想对待可能会流失的客户,因为忠实的用户无论如何都会返回该产品。我们可能会发现,最可行的群体是不到一年前加入并在上个月将支出减少30%以上的客户。 交易企业通常会有一群客户亏钱的客户。例如,银行客户通过了验证,并定期寻求客户支持(因此生成的入职和维修费用),同时几乎没有交易(因此没有产生任何收入)。该银行可能会为其帐户中不到1000美元的客户提供每月少量订阅费,因为他们可能是不可行的。
  • 想象一下,我们的产品中看到了大量的欺诈浪潮,并且我们希望限制特定客户的登机,以降低这种风险。例如,我们发现大多数欺诈者都有来自某些国家 /地区的特定用户代理和IP地址。
  • 另一种选择是将优惠券发送给客户在我们的在线商店中使用。但是,我们只想对待可能会流失的客户,因为忠实的用户无论如何都会返回该产品。我们可能会发现,最可行的群体是不到一年前加入并在上个月将支出减少30%以上的客户。
  • 实施的速度和复杂性。 可解释性。 合规性。
  • 我们将讨论可以从数据中挖掘此类规则的模型,
  • 决策树 Sklearn

    案例

    银行营销