2 个月前

GAIN:使用生成对抗网络进行缺失数据填补

Jinsung Yoon; James Jordon; Mihaela van der Schaar
GAIN:使用生成对抗网络进行缺失数据填补
摘要

我们提出了一种基于广为人知的生成对抗网络(GAN)框架的新方法来填补缺失数据。因此,我们将该方法称为生成对抗填补网络(Generative Adversarial Imputation Nets, GAIN)。生成器(G)观察到真实数据向量的某些部分,根据实际观察到的部分填补缺失部分,并输出一个完整的向量。判别器(D)随后接收这个完成后的向量,试图确定哪些部分是实际观察到的,哪些部分是填补的。为了确保判别器D能够迫使生成器G学习所需的分布,我们为D提供了一些额外的信息,即提示向量。提示向量向D揭示了关于原始样本缺失情况的部分信息,使D能够集中注意力评估特定部分的填补质量。这一提示确保了G确实学会了根据真实数据分布进行生成。我们在多种数据集上测试了我们的方法,并发现GAIN显著优于现有的最先进填补方法。

GAIN:使用生成对抗网络进行缺失数据填补 | 最新论文 | HyperAI超神经