
自然および人為的なプロセスの研究では、しばしば時系列(Time Series: TS)と呼ばれる時間的に順序付けられた値の長大な系列が得られる。このようなプロセスは、たとえば機械の稼働モードなど、複数の状態を含むことが多く、観測対象のプロセスにおける状態変化は、測定値の分布や形状に変化をもたらす。時系列分割(Time Series Segmentation: TSS)は、こうした変化を後から検出することで、データ生成プロセスの変化を推定することを目的としている。TSSは一般的に、統計的性質によって区別可能なセグメントを同定することを目的とした教師なし学習問題として扱われる。しかし、現在のTSSアルゴリズムは、ユーザーがドメイン依存のハイパーパラメータを設定する必要があり、TS値の分布や検出可能な変化の種類について前提を置いているため、適用範囲が限定される。代表的なハイパーパラメータとして、セグメントの均一性の尺度や変化点の数があるが、これらは各データセットに対して特に調整が困難である。本研究では、ハイパーパラメータ不要かつドメインに依存しない、高い精度を実現する新しいTSS手法であるClaSPを提案する。ClaSPは、時系列を階層的に二つの部分に分割するアプローチを採用する。各可能な分割点に対して二値時系列分類器を訓練し、その分割がどちらの部分に属する部分列を最も正確に識別できるかを評価することで、変化点を決定する。ClaSPは、データから主な二つのモデルパラメータを学習するための、二つの独自開発のアルゴリズムを用いている。107のデータセットから構成されるベンチマークを用いた実験評価において、ClaSPが最先端手法を上回る精度を示し、高速かつスケーラブルであることを示した。さらに、いくつかの実世界の事例研究を通じて、ClaSPの特徴と実用性を明らかにした。