Anomalieerkennung mittels Oversampling-Principal-Component-Analyse
Zusammenfassung Die Detektion von Ausreißern ist eine wichtige Aufgabe im Bereich der Datenmining-Forschung und wurde in verschiedenen Forschungsbereichen untersucht. Sie ermöglicht die Erkennung einer geringen Menge abweichender Datenpunkte. In diesem Artikel verwenden wir das „Leave-One-Out“-Verfahren, um für jeden einzelnen Datenpunkt zu überprüfen, ob dessen Einfluss auf die Varianz der Hauptachsen signifikant ist (d. h. ob er mit oder ohne Berücksichtigung die Richtung der Hauptkomponenten verändert). Auf dieser Grundlage wird ein überproportionales Stichprobensystem zur Hauptkomponentenanalyse vorgeschlagen, das die Auswirkung eines abnormalen Datenpunkts (bzw. Ausreißers) besonders hervorhebt. Neben der Identifikation verdächtiger Ausreißer wird auch ein on-line-Anomalieerkennungsverfahren entwickelt, um neu ankommende Anomalien zu detektieren. Zudem wird die schnelle Aktualisierung der Hauptachsen untersucht, um eine effiziente Berechnung und die Erfüllung der Anforderungen an die on-line-Detektion zu gewährleisten. Numerische Experimente zeigen, dass das vorgeschlagene Verfahren sowohl in Bezug auf die Berechnungszeit als auch auf die Genauigkeit der Anomalieerkennung effektiv ist.