HyperAI

Anomalieerkennung

Unter Anomalieerkennung versteht man die Identifizierung von Elementen, Ereignissen oder Beobachtungen, die nicht mit dem erwarteten Muster oder anderen Elementen im Datensatz übereinstimmen. Typischerweise erweisen sich Anomalien als Bankbetrug, strukturelle Mängel, medizinische Probleme, Textfehler usw.

Anwendung der Anomalieerkennungstechnologie

Techniken zur Anomalieerkennung werden in verschiedenen Bereichen eingesetzt, beispielsweise bei der Erkennung von Eindringlingen, Betrugserkennung, Fehlererkennung, Systemintegritätsüberwachung, Ereigniserkennung in Sensornetzwerken und Erkennung von Störungen des Ökosystems. Es wird häufig verwendet, um während der Vorverarbeitung Ausreißer aus einem Datensatz zu entfernen, was die Genauigkeit beim überwachten Lernen erheblich verbessern kann.

Klassifizierung von Methoden zur Anomalieerkennung

Unüberwachte Methoden zur Anomalieerkennung können Anomalien in unbeschrifteten Testdaten erkennen, indem sie Instanzen finden, die am wenigsten mit anderen Daten übereinstimmen.

Überwachte Methoden zur Anomalieerkennung erfordern einen Datensatz, der als „normal“ und „abnormal“ gekennzeichnet wurde, und beinhalten das Trainieren eines Klassifikators.

Halbüberwachte Methoden zur Anomalieerkennung erstellen ein Modell, das auf der Grundlage eines gegebenen normalen Trainingsdatensatzes normales Verhalten darstellt, und ermitteln dann die Wahrscheinlichkeit von Testinstanzen, die vom erlernten Modell generiert werden.

  • Modellbasierte Techniken: Viele Techniken zur Anomalieerkennung erstellen zunächst ein Datenmodell, und Anomalien sind jene Objekte, die nicht perfekt in das Modell passen.
  • Auf Nähe basierende Techniken: Oft kann ein Näherungsmaß zwischen Objekten definiert werden, wobei Ausreißerobjekte diejenigen sind, die weit von den meisten anderen Objekten entfernt sind.
  • Dichtebasierte Techniken: Dichteschätzungen von Objekten können relativ direkt berechnet werden, insbesondere wenn ein Näherungsmaß zwischen Objekten vorliegt.

Anwendungsszenario

  • Betrugserkennung: Erkennung der Kartensicherheit
  • Intrusion Detection: Erkennen von Eindringlingen in Computersysteme
  • Medizinischer Bereich: Prüfung der menschlichen Gesundheit