获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
摘要 - 本文提出了一种新的在线功能选择方法,并意识到群体公平。它的症结在于优化所选特征子集中产生模型的准确性和公平性之间的权衡。我们设置的技术挑战是双重的:1)流媒体功能输入,因此,如果其信息已被其之前到达的其他类似功能涵盖的信息可能会过时或重新进行预测,而2)2)非缔合功能相关性,从而使这些偏见可能从这些看似可理解的,未经保护的功能中泄漏出来。为了克服这一点,我们提出了通过因果公平(SFCF)的流式特征选择,该特征选择分别构建了两个因果图,分别为预测标签和受保护特征,努力建模流媒体特征,标签和受保护信息之间的复杂相关结构。因此,可以通过去除这些特征与受保护的特征相关但与标签无关的因果关系来从预测建模中消除偏差。我们认为,当大量删除的功能(未受保护但可用于重建偏见信息)损害学习准确性时,最初的预测功能后来可以被接受。我们在流式传输特征研究中广泛使用的五个数据集上的SFCF基准,结果证明了其在六个竞争对手模型上的性能优越性,就特征选择的效率和稀疏性而言,以及由此产生的预测模型的均衡优势。