18일 전

ClaSP - 시계열 세그멘테이션

{Ulf Leser, Arik Ermshaus, Patrick Schäfer}
초록

생물학적 또는 물리적 과정을 연구할 때 종종 시간 순서대로 정렬된 길고 복잡한 값의 시계열(시간 시리즈, TS) 데이터를 얻게 된다. 관측된 과정의 변화, 예를 들어 자연 현상이나 내부 상태 변화의 결과로 측정된 값 역시 변화하게 된다. 시간 시리즈 분할(TSS: Time Series Segmentation)은 이러한 변화를 탐지하여 기저 과정의 변화를 추론하는 것을 목표로 한다. TSS는 일반적으로 통계적 특성에 따라 구분 가능한 구간을 식별하는 것을 목표로 하는 비지도 학습 문제로 접근된다. 본 연구에서는 TSS에 대한 새로운 고정밀도 방법인 ClaSP를 제안한다. ClaSP는 시간 시리즈를 계층적으로 두 부분으로 나누는 방식으로 작동하며, 각 분할점은 가능한 모든 분할 지점에 대해 이진 시간 시리즈 분류기를 학습하고, 가장 높은 정확도를 보이는 분할점을 선택함으로써 결정된다. 즉, 해당 분할점이 두 부분에 속하는 부분 시리즈를 가장 잘 구분할 수 있도록 한다. 98개 데이터셋으로 구성된 벤치마크를 활용한 실험 평가를 통해, ClaSP가 기존 최고 성능 기법보다 정확도에서 뛰어나며, 두 번째로 빠른 방법보다도 빠른 속도를 보임을 입증하였다. 또한 실제 산업 및 과학 데이터를 활용한 사례를 통해 ClaSP의 주요 특징과 실용성을 강조한다.

ClaSP - 시계열 세그멘테이션 | 최신 연구 논문 | HyperAI초신경