ClaSP – Zeitreihensegmentierung
Die Untersuchung biologischer oder physikalischer Prozesse führt oft zu langen Folgen zeitlich geordneter Werte, sogenannten Zeitreihen (Time Series, TS). Veränderungen in den beobachteten Prozessen – beispielsweise hervorgerufen durch natürliche Ereignisse oder interne Zustandsänderungen – bewirken entsprechende Veränderungen in den gemessenen Werten. Die Zeitreihensegmentierung (Time Series Segmentation, TSS) zielt darauf ab, solche Veränderungen innerhalb einer Zeitreihe zu identifizieren, um Rückschlüsse auf Veränderungen des zugrundeliegenden Prozesses zu ziehen. TSS wird typischerweise als Problem des überwachungsfreien Lernens angegangen, wobei die Zielsetzung darin besteht, Segmente zu finden, die sich durch bestimmte statistische Eigenschaften unterscheiden. Wir stellen ClaSP vor, eine neuartige und hochgenaue Methode zur Zeitreihensegmentierung. ClaSP unterteilt eine Zeitreihe hierarchisch in zwei Teile, wobei jeder Teilungspunkt durch das Training eines binären Klassifikators für jede mögliche Teilungsstelle bestimmt wird und derjenige ausgewählt wird, der die höchste Genauigkeit erzielt – also derjenige, der die Teilfolgen am besten in die beiden Partitionen zuordnen kann. In unserer experimentellen Evaluierung anhand einer Benchmark mit 98 Datensätzen zeigen wir, dass ClaSP die aktuell beste Methode hinsichtlich Genauigkeit übertrifft und zudem schneller ist als die zweitbeste Methode. Wir verdeutlichen die Eigenschaften von ClaSP anhand mehrerer realer Zeitreihen aus der Praxis.