HyperAI

Unterabtastung

UnterabtastungEs handelt sich um eine Methode zum Ausgleichen von Klassenungleichgewichten durch das Verwerfen von Stichproben. Dies kann als Unterabtastung der Kategorien mit einer großen Anzahl von Stichproben im Trainingssatz verstanden werden.

Der Zweck der Unterabtastung von Daten besteht darin, das Problem ungleichmäßiger Kategorien während der Stichprobennahme zu lösen. Neben Undersampling und Oversampling ist es auch möglich, die beiden Techniken zu Hybridstrategien zu kombinieren, wie beispielsweise SMOTE und Tomek Link, SMOTE und Edited Nearest Neighbor ENN.

Andere Ansätze zum Lernen mit unausgewogenen Datensätzen, wie etwa das Gewichten von Trainingsinstanzen, führen zu unterschiedlichen Fehlklassifizierungs- und Bootstrapping-Kosten für positive und negative Beispiele.

Verwandte Begriffe: Oversampling, Klassenungleichgewicht

Verweise

【1】https://www.cnblogs.com/Determined22/p/5772538.html

【2】https://en.wikipedia.org/wiki/Oversampling_and_undersampling_in_data_analysis