ClaSP – parameterfreie Zeitreihensegmentierung

Die Untersuchung natürlicher und künstlich geschaffener Prozesse führt oft zu langen Folgen zeitlich geordneter Werte, sogenannten Zeitreihen (Time Series, TS). Solche Prozesse bestehen häufig aus mehreren Zuständen – beispielsweise Betriebsmodi einer Maschine – wodurch Zustandswechsel im beobachteten Prozess zu Veränderungen in der Verteilung der gemessenen Werte führen. Die Zeitreihensegmentierung (Time Series Segmentation, TSS) versucht, solche Veränderungen post-hoc in der Zeitreihe zu identifizieren, um Rückschlüsse auf Veränderungen im datenerzeugenden Prozess zu ziehen. TSS wird typischerweise als ein Problem des unüberwachten Lernens angegangen, das darauf abzielt, Segmente zu erkennen, die sich durch eine bestimmte statistische Eigenschaft unterscheiden. Aktuelle Algorithmen zur TSS erfordern jedoch domainabhängige Hyperparameter, die vom Benutzer vorgegeben werden müssen, oder machen Annahmen über die Verteilung der Zeitreihenwerte oder die Art der erkennbaren Änderungen, was ihre Anwendbarkeit einschränkt. Häufige Hyperparameter sind die Homogenitätsmaßzahl für Segmente und die Anzahl der Änderungspunkte, die sich besonders schwierig für jedes Datenset abstimmen lassen. Wir präsentieren ClaSP, eine neuartige, hochgenaue, hyperparameterfreie und domain-agnostische Methode für die TSS. ClaSP unterteilt eine Zeitreihe hierarchisch in zwei Teile. Ein Änderungspunkt wird dadurch bestimmt, dass für jeden möglichen Spaltpunkt ein binärer Zeitreihenklassifikator trainiert wird und derjenige Spaltpunkt ausgewählt wird, der am besten zwischen den Teilsequenzen der beiden Partitionen unterscheidet. ClaSP lernt seine beiden zentralen Modellparameter anhand der Daten mithilfe zweier neuartiger, speziell für diesen Zweck entwickelter Algorithmen. In unserer experimentellen Evaluierung an einem Benchmark aus 107 Datensätzen zeigen wir, dass ClaSP die derzeit beste Leistung in Bezug auf Genauigkeit erzielt und gleichzeitig schnell und skalierbar ist. Darüber hinaus beleuchten wir anhand mehrerer Fallstudien aus der Praxis besondere Eigenschaften von ClaSP.