18일 전

ClaSP — 파라미터 자유형 시계열 세그멘테이션

Arik Ermshaus, Patrick Schäfer, Ulf Leser
ClaSP — 파라미터 자유형 시계열 세그멘테이션
초록

자연적 및 인위적 과정의 연구는 일반적으로 시간 순서가 지정된 긴 값 시퀀스, 즉 시계열(Time Series, TS)을 초래한다. 이러한 과정은 기계의 작동 모드와 같이 다수의 상태를 포함하는 경우가 많으며, 관측된 과정 내 상태 변화는 측정된 값의 분포 및 형태 변화로 이어진다. 시계열 분할(Time Series Segmentation, TSS)은 이러한 변화를 사후적으로 탐지하여 데이터 생성 과정의 변화를 추론하고자 하는 기법이다. TSS는 일반적으로 통계적 특성에 따라 구분 가능한 세그먼트를 식별하는 것을 목표로 하는 비지도 학습 문제로 접근된다. 그러나 기존의 TSS 알고리즘은 사용자가 도메인에 따라 조정해야 하는 하이퍼파라미터를 필요로 하며, 시계열 값의 분포나 탐지 가능한 변화 유형에 대한 가정을 내포하고 있어 적용 범위가 제한된다. 일반적으로 사용되는 하이퍼파라미터로는 세그먼트 내 균일성 측정 기준과 변화점 수가 있으며, 이는 각 데이터셋에 대해 조정하기 매우 어렵다. 본 연구에서는 정확도가 높고 하이퍼파라미터가 없으며 도메인에 무관한 새로운 TSS 방법인 ClaSP를 제안한다. ClaSP는 시계열을 계층적으로 두 부분으로 나누는 방식을 취한다. 각 가능한 분할 지점에 대해 이진 시계열 분류기를 학습하고, 두 부분에 속한 부분 시계열을 구분하는 데 가장 효과적인 분할점을 선택함으로써 변화점을 결정한다. ClaSP는 두 가지 새로 개발한 맞춤형 알고리즘을 통해 데이터로부터 주요 두 모델 파라미터를 자동으로 학습한다. 107개 데이터셋으로 구성된 벤치마크를 활용한 실험 평가 결과, ClaSP는 정확도 면에서 최신 기술을 능가하며, 빠르고 확장성도 우수함을 입증하였다. 또한 여러 실제 사례 연구를 통해 ClaSP의 주요 특성을 강조하였다.

ClaSP — 파라미터 자유형 시계열 세그멘테이션 | 최신 연구 논문 | HyperAI초신경