11일 전

TSEM: 다변량 시계열을 위한 시간 가중 치수 설명 가능 신경망

Anh-Duy Pham, Anastassia Kuestenmacher, Paul G. Ploeger
TSEM: 다변량 시계열을 위한 시간 가중 치수 설명 가능 신경망
초록

딥러닝은 유연성과 적응성 덕분에 기술적 및 비즈니스 분야에서 통용되는 일괄적인 해결책으로 자리 잡았다. 그러나 이는 투명하지 않은 모델을 기반으로 구현되며, 결과의 신뢰성에 부정적인 영향을 미친다. 특히 시계열 데이터에 기반한 시스템의 동작을 보다 깊이 이해하기 위해서는, 후처리형 해석 가능한 인공지능(Explainable Artificial Intelligence, XAI) 기법을 통해 딥러닝 모델 내부를 분석하는 것이 중요하다. 시계열 데이터를 위한 XAI는 주로 모델 독립형(model-agnostic)과 모델 특화형(model-specific) 두 가지 유형으로 나뉜다. 본 연구에서는 모델 특화형 접근법을 채택한다. 기존의 접근법들이 클래스 활성화 맵(Class Activation Mapping, CAM) 또는 주의 메커니즘(Attention Mechanism) 중 하나를 사용하는 반면, 본 연구는 두 전략을 통합하여 단일 시스템으로 구현하였으며, 이를 다변량 시계열 데이터를 위한 시간적으로 가중된 공간-시간 해석 가능 신경망(Temporal Weighted Spatiotemporal Explainable Neural Network for Multivariate Time Series, TSEM)이라 명명한다. TSEM은 RNN의 은닉 유닛을 CNN 특징맵의 시간축에 대한 주의 가중치로 활용함으로써, RNN과 CNN 모델의 장점을 결합한다. 실험 결과, TSEM은 XCM보다 우수한 성능을 보였으며, 정확도 면에서는 STAM과 유사한 수준을 유지하면서도 인과성, 충실도, 공간-시간 일관성 등의 해석 가능성 기준을 모두 충족시켰다.

TSEM: 다변량 시계열을 위한 시간 가중 치수 설명 가능 신경망 | 최신 연구 논문 | HyperAI초신경