2달 전
GAIN: Generative Adversarial Nets을 이용한 결측 데이터 보완
Jinsung Yoon; James Jordon; Mihaela van der Schaar

초록
우리는 잘 알려진 생성적 적대 네트워크(GAN) 프레임워크를 적용하여 결측 데이터를 보정하는 새로운 방법을 제안합니다. 이에 따라 우리의 방법을 생성적 적대 보정 네트워크(Generative Adversarial Imputation Nets, GAIN)라고 명명하였습니다. 생성기(G)는 실제 데이터 벡터의 일부 성분을 관찰하고, 실제로 관찰된 내용을 조건으로 하여 결측 성분을 보정하며 완성된 벡터를 출력합니다. 구분기(D)는 완성된 벡터를 받아 실제로 관찰된 성분과 보정된 성분을 구별하려고 시도합니다. G가 원하는 분포를 학습하도록 하기 위해 D에게 힌트 벡터 형태로 추가 정보를 제공합니다. 힌트 벡터는 원본 샘플의 결측 상태에 대한 부분적인 정보를 D에게 제공하여, 특정 성분의 보정 품질에 주목할 수 있도록 합니다. 이 힌트는 G가 실제로 진짜 데이터 분포에 따라 생성하도록 학습한다는 것을 보장합니다. 우리는 다양한 데이터셋에서 우리의 방법을 검증하였으며, GAIN이 최신의 결측치 보정 방법들보다 크게 우수함을 확인하였습니다.