11일 전
E2GAN: 엔드투엔드 생성적 적대 신경망 또는 다변량 시계열 데이터 누락치 보정
{Xiangrui Cai, Yonghong Luo, Xiaojie Yuan, Ying Zhang}

초록
다변량 시계열 데이터에서 희소한 값(missing values)은 대부분의 경우에 존재하며, 이는 고급 분석을 방해한다. 기존의 보간 방법들은 희소값을 처리하기 위해 삭제법, 통계적 보간법, 기계학습 기반 보간법, 생성형 보간법 등을 사용하고 있으나, 이러한 방법들은 시계열 정보를 효과적으로 처리하지 못하거나 다단계(multi-stage) 구조를 가지는 등의 한계를 지닌다. 본 논문에서는 다변량 시계열 데이터의 희소값을 보간하기 위해 엔드투엔드(end-to-end) 생성 모델인 E2GAN을 제안한다. E2GAN은 판별 손실(discriminative loss)과 제곱 오차 손실(squared error loss)을 활용하여, 단일 단계(one stage)에서 가장 유사한 완전한 시계열 데이터를 생성함으로써 불완전한 시계열 데이터를 보간할 수 있다. 다양한 실세계 데이터셋에 대한 실험 결과, 제안 모델은 기준 모델 대비 보간 정확도에서 우수한 성능을 보이며, 하류 응용 분야인 분류 및 회귀 작업에서도 최신 기술 수준(state-of-the-art)의 성능을 달성하였다. 또한, 신경망 학습 과정에서 다단계 방법에 비해 더 뛰어난 시간 효율성을 확보하였다.