비지도 딥 이상 탐지 기법을 활용한 다중 센서 시계열 신호에 대한 이상 탐지

현재 다중 센서 기술은 헬스케어(HC), 인간 활동 인식(HAR), 산업 제어 시스템(ICS) 등 다양한 분야에 적용되고 있다. 이러한 센서들은 방대한 양의 다변량 시계열 데이터를 생성할 수 있다. 다중 센서 시계열 데이터에 대한 비지도 이상 탐지 기법은 머신러닝 연구에서 핵심적인 역할을 해왔으며, 그 핵심 과제는 다중 센서 데이터 내의 공간-시간 상관관계를 포착함으로써 일반화된 정상 패턴을 탐지하는 것이다. 이 과제를 넘어서, 훈련 데이터에 노이즈 데이터가 뒤섞여 있는 경우가 흔하며, 이는 정상, 비정상, 노이즈 데이터를 구분하기 어려워 모델을 오도할 가능성이 크다. 기존 연구 중 이러한 두 가지 과제를 동시에 해결한 사례는 극히 드물다. 본 논문에서는 새로운 딥러닝 기반 이상 탐지 알고리즘인 ‘심층 컨볼루셔널 오토인코딩 메모리 네트워크(Deep Convolutional Autoencoding Memory network, CAE-M)’를 제안한다. 먼저, 최대 평균 차이(MMD)를 활용하여 다중 센서 데이터의 공간적 의존성을 특성화하는 심층 컨볼루셔널 오토인코더를 구축함으로써 노이즈, 정상, 비정상 데이터를 더 잘 구분할 수 있도록 한다. 이후, 시계열 데이터의 시간적 의존성을 포착하기 위해 선형 예측(자기회귀 모델, Autoregressive Model)과 비선형 예측(Bidirectional LSTM with Attention)을 조합한 메모리 네트워크를 설계한다. 마지막으로, CAE-M는 이 두 하위 네트워크를 공동 최적화한다. 제안된 방법을 HAR 및 HC 데이터셋에서 여러 최신 이상 탐지 기법과 실험적으로 비교한 결과, 제안 모델이 기존 방법들을 모두 상회함을 확인할 수 있었다.