18일 전

비지도 오프라인 변경점 탐지 앙상블

{Maksimov I., Lobachev V, Kozitsin V, Katser I}
초록

오프라인 변화점 탐지(Changepoint Detection, CPD) 알고리즘은 신호를 최적의 방식으로 분할하는 데 사용된다. 일반적으로 이러한 알고리즘은 신호의 통계적 특성 변화가 사전에 알려져 있다는 가정에 기반하며, 적절한 모델(지표, 비용 함수)을 활용하여 변화점을 탐지한다. 그러나 이러한 모델이 정확히 알려져 있지 않을 경우, 적절한 모델 선택 과정은 번거롭고 시간이 오래 걸리며, 결과의 신뢰성도 보장되지 않을 수 있다. 비록 앙상블(Ensemble) 접근법이 개별 알고리즘의 견고성(로버스트성)을 높이고 위에서 언급한 도전 과제를 해결하는 데 효과적이라는 점은 잘 알려져 있으나, 이상치 탐지나 분류 문제에 비해 CPD 문제에서는 앙상블 기법이 상대적으로 약하게 형식화되어 있으며, 다소 덜 주목받고 있다. 본 논문은 오프라인 분석 중 변화점 탐지 절차를 수행하기 전에 여러 비용 함수를 사전에 통합(aggregation)하는 비지도형 CPD 앙상블(CPDE) 절차를 제안한다. 제안된 앙상블 알고리즘의 의사코드(pseudocode) 및 파이썬 실현 코드에 대한 링크도 제공한다. 본 연구의 주요 기여는 변화점 탐지 절차 전에 다수의 비용 함수를 통합하는 방식으로, 분석의 정확도와 안정성을 향상시키는 데 있다. 수치 실험을 통해 제안된 CPDE가 비앙상블 CPD 절차보다 우수한 성능을 보임을 확인하였다. 또한, 다양한 CPD 알고리즘, 스케일링(Scaling) 함수, 그리고 통합(aggregation) 함수의 특성을 분석하고, 실험을 통해 비교하였다. 실험 결과는 산업적 이상(고장 및 실패)을 포함하는 두 가지 이상 탐지 벤치마크인 테네시 이스트먼 프로세스(Tennessee Eastman Process, TEP)와 스콜텍 이상 벤치마크(Skoltech Anomaly Benchmark, SKAB)에서 도출되었다. 본 연구의 가능 응용 분야 중 하나는 기술 진단에서 고장 식별 및 고장 격리 문제에 있어서 고장 발생 시점의 추정에 있다.