使用模仿的平衡数据集审计模型偏差

了解如何使用 Mimesis 库生成平衡的反事实数据集,帮助分析模型中的潜在偏差。

来源:KDnuggets

简介

无论是完善的分类器还是大型语言模型 (LLM) 等最先进的大规模模型,构建机器学习解决方案通常都会带来风险:算法可能会默默地采用它们所训练的历史训练数据集中固有的偏见。但在高风险场景或数据敏感的场景中,我们如何在不损害现实世界信息的情况下审核模型是否存在偏见?

这篇实践文章将指导您根据有偏差的数据训练一个简单的“贷款审批”分类模型。基于此,我们将使用 Mimesis,一个开源库,可以帮助生成完美平衡的反事实数据集。您将能够测试具有相同财务背景但不同人口特征的“假”用户,从而确定模型是否歧视某些群体。

分步指南

如果您不熟悉使用 Mimesis 库,或者您正在使用 Colab 等云笔记本环境,请首先安装 Mimesis 库:

在审核模型之前,我们实际上需要得到一个!在这个例子中,我们将综合生成一个包含 1,000 个银行客户的数据集,只有两个特征:性别和收入。这些特征分别是分类特征和数值特征。数据创建将被有意操纵,以便性别属性不公平地影响二元结果:贷款批准。具体来说,为了标记数据集,我们将考虑这样一种情况:男性通常会被批准,而女性只有在收入非常高时才会被批准。

创建这个明显有偏差的数据集并在其上训练决策树分类器的过程如下所示:

例如,三个新创建的配置文件可能类似于:

[{'Applicant_ID': '1f1721e1-19af-4bd1-8488-6abf01404ef9', '收入': 44815},

{'Applicant_ID': '5c862597-7f55-43f4-9d6e-ac9cc0b9083e', '收入': 47436},{'Applicant_ID': '3479d4cf-0d9b-4f06-9c43-1c3b7e787830', '收入': 58194}]总结