Unsupervised Offline Changepoint Detection Ensembles
Offline-Änderungspunktdetektions-(CPD-)Algorithmen werden zur optimalen Signalsegmentierung eingesetzt. Im Allgemeinen basieren diese Algorithmen auf der Annahme, dass die sich ändernden statistischen Eigenschaften des Signals bekannt sind, und es werden geeignete Modelle (Metriken, Kostenfunktionen) zur Änderungspunktdetektion verwendet. Andernfalls kann der Prozess der angemessenen Modellauswahl mühsam und zeitaufwendig werden und unsichere Ergebnisse liefern. Obwohl ein Ensembles-Ansatz bekanntermaßen zur Steigerung der Robustheit einzelner Algorithmen und zur Bewältigung genannter Herausforderungen beiträgt, ist er für CPD-Probleme weniger formalisiert und deutlich weniger untersucht als für Outlier-Detektion oder Klassifikationsprobleme. In diesem Artikel wird ein unsupervisierter CPD-Ensemble-(CPDE-)Ansatz vorgestellt, der die Pseudocodes der spezifischen vorgeschlagenen Ensemble-Algorithmen sowie einen Link zu ihrer Python-Implementierung enthält. Der Innovationsgehalt des Ansatzes liegt in der Aggregation mehrerer Kostenfunktionen vor der Änderungspunktsuche, die während der Offline-Analyse durchgeführt wird. Die numerische Experimentation zeigte, dass der vorgeschlagene CPDE-Ansatz nicht-ensemblebasierte CPD-Verfahren übertrifft. Zudem wurde im Rahmen der Experimente eine Analyse gängiger CPD-Algorithmen, Skalierungsfunktionen und Aggregationsfunktionen durchgeführt und miteinander verglichen. Die Ergebnisse wurden an zwei Anomalie-Benchmarks erzielt, die industrielle Störungen und Ausfälle enthalten – dem Tennessee Eastman Process (TEP) und dem Skoltech Anomaly Benchmark (SKAB). Eine mögliche Anwendung unserer Forschung liegt in der Schätzung der Ausfallzeit für Probleme der Fehlererkennung und -isolierung in der technischen Diagnose.