2달 전
조건부 GAN을 사용한 표 형식 데이터 모델링
Lei Xu; Maria Skoularidou; Alfredo Cuesta-Infante; Kalyan Veeramachaneni

초록
표 형식 데이터의 행에 대한 확률 분포를 모델링하고 실제와 유사한 합성 데이터를 생성하는 것은 쉽지 않은 작업입니다. 표 형식 데이터는 일반적으로 이산형과 연속형 열의 혼합을 포함합니다. 연속형 열은 여러 모드를 가질 수 있으며, 이산형 열은 때때로 불균형하여 모델링을 어렵게 만듭니다. 기존의 통계적 모델과 딥 뉴럴 네트워크 모델은 이러한 유형의 데이터를 적절히 모델링하지 못합니다. 우리는 이러한 도전 과제를 해결하기 위해 조건부 생성적 적대 신경망(Generative Adversarial Network, GAN)을 사용하는 TGAN을 설계하였습니다. 공정하고 철저한 비교를 돕기 위해 7개의 시뮬레이션 데이터셋과 8개의 실제 데이터셋, 그리고 여러 베이지안 네트워크 기준선을 사용한 벤치마크를 설계하였습니다. TGAN은 대부분의 실제 데이터셋에서 베이지안 방법보다 우수한 성능을 보였으며, 다른 딥 러닝 방법들은 그러지 못했습니다.