ClaSP - Segmentation de séries temporelles
L’étude des processus biologiques ou physiques conduit souvent à des séries temporelles (TS), c’est-à-dire des suites longues de valeurs ordonnées temporellement. Les variations des processus observés, qu’elles soient causées par des événements naturels ou des changements d’état internes, se traduisent par des modifications des valeurs mesurées. La segmentation de séries temporelles (TSS) vise à détecter ces changements dans les TS afin d’en déduire des ruptures dans le processus sous-jacent. La TSS est généralement abordée comme un problème d’apprentissage non supervisé, dont l’objectif est d’identifier des segments distinguables selon certaines propriétés statistiques. Nous présentons ClaSP, une nouvelle méthode très précise pour la TSS. ClaSP divise hiérarchiquement une série temporelle en deux parties, en déterminant chaque point de coupure par l’entraînement d’un classificateur binaire de séries temporelles pour chaque point de coupure possible, puis en sélectionnant celui qui atteint la meilleure précision — c’est-à-dire celui qui est le plus efficace pour distinguer les sous-séries appartenant à l’une ou l’autre des partitions. Dans notre évaluation expérimentale basée sur une base de référence comprenant 98 jeux de données, nous démontrons que ClaSP surpasser l’état de l’art en termes de précision et est également plus rapide que la deuxième meilleure méthode. Nous illustrons les propriétés de ClaSP à l’aide de plusieurs séries temporelles issues de cas réels.