数字时代为金融机构提供了大量数据。审议的问题在利用该数据的全部潜力方面提出了挑战。生成合成数据是允许对本数据中包含的作用和趋势分析而不会损害隐私的最有希望的解决方案之一。尽管生成合成数据的初始方法是基本的,但新兴的生成模型已经阐明了可能性。但是,为独特数据集生成综合数据,例如银行交易序列,仍然具有挑战性。这些序列表现出由各种客户交易行为驱动的复杂能力,将它们与其他数据类型中更可预测的模式区分开来。我们提出了Bankgan,这是一种专门为合成的银行交易序列而设计的有条件的表格GAN架构,该序列表现出非均匀的日期模式。我们表明,Bankgan在与真实数据相似的相似之处方面优于基于经常性的神经网络(RNN)模型。此外,它在复制周期性交易的特征方面表现出色,超过了RNN和基于变压器的模型。Bankgan通过在不损害数据质量的情况下生成隐私的合成数据来分歧自己,这与现有模型形成了鲜明的对比,在该模型中添加隐私保证保证通常会降低性能。
主要关键词