HyperAIHyperAI
vor 17 Tagen

Verbesserung der Modellleistung und Beseitigung des Problems der Klassenungleichgewichts durch Daten-Augmentation

{Dr. Venkateswara Rao Gurrala, Allena Venkata Sai Abhishek}
Abstract

Die Daten in der realen Welt bestehen aus einer Vielzahl unterschiedlicher, oft problematischer Merkmale. Ein besonders häufig auftretendes Problem ist die Klassenungleichgewichtigkeit, bei der die Anzahl der Beispiele in den verschiedenen Klassen eines Datensatzes ungleich verteilt ist. Dieses Klassenungleichgewicht wird durch verschiedene Sampling-Techniken im Datenvorverarbeitungsschritt angegangen. Eine zentrale Methode hierbei ist die Datenverstärkung (Augmentation), die einen wesentlichen Schritt in jedem maschinellen Lernpipeline darstellt und insbesondere zur Überproportionalisierung der Minderheitsklassen genutzt wird. In dieser Arbeit wird die Modellleistung durch die Beseitigung des Klassenungleichgewichts verbessert, indem verschiedene Augmentation-Ansätze eingesetzt werden, um ausgewogene, vergrößerte Datensätze mittels unterschiedlicher Datenverstärkungstechniken und zufälliger Stichprobentechniken zu generieren. Für jede Augmentationstechnik werden die Genauigkeitswerte mit einem RESNET18-Modell ermittelt. Das Modell wird jeweils bis zu 100 Epochen trainiert, und die höchsten erzielten Genauigkeiten werden miteinander verglichen. Die iterative Analyse verschiedener Augmentationstechniken liefert beeindruckende Erkenntnisse über die Wirksamkeit der unterschiedlichen Datensätze.