HyperAIHyperAI
vor 12 Tagen

Isolation Forest

{Zhi-Hua Zhou, Kai Ming Ting, Fei Tony Liu}
Abstract

Die meisten bestehenden modellbasierten Ansätze zur Anomalieerkennung erstellen ein Profil normaler Instanzen und identifizieren anschließend Instanzen, die nicht dem normalen Profil entsprechen, als Anomalien. In dieser Arbeit wird ein grundlegend andersartiger modellbasierter Ansatz vorgestellt, der Anomalien explizit isoliert, anstatt Profile normaler Punkte zu konstruieren. So weit uns bekannt ist, wurde der Begriff der Isolation in der aktuellen Literatur bisher nicht erforscht. Die Nutzung der Isolation ermöglicht es dem vorgeschlagenen Verfahren, iForest, die Unterstichprobung (sub-sampling) in einem Umfang auszunutzen, der in bestehenden Methoden nicht realisierbar ist. Dadurch entsteht ein Algorithmus mit linearer Zeitkomplexität, einer niedrigen Konstanten und geringem Speicherbedarf. Unsere empirische Evaluation zeigt, dass iForest hinsichtlich der AUC und der Verarbeitungszeit sowohl gegenüber ORCA, einem nahezu linear skalierenden, auf Distanzen basierenden Verfahren, als auch gegenüber LOF und Random Forests, insbesondere bei großen Datensätzen, überzeugt. Darüber hinaus zeigt iForest gute Leistung bei hochdimensionalen Problemen mit einer großen Anzahl irrelevanter Merkmale sowie in Situationen, in denen der Trainingsdatensatz keine Anomalien enthält.

Isolation Forest | Neueste Forschungsarbeiten | HyperAI