Datenerweiterung
Datenerweiterung ist eine Technik, bei der der Trainingssatz künstlich erweitert wird, indem mithilfe vorhandener Daten eine geänderte Kopie des Datensatzes erstellt wird., eine der häufig verwendeten Techniken beim Deep Learning, beinhaltet das Vornehmen kleiner Änderungen am Datensatz oder die Verwendung von Deep Learning zum Generieren neuer Datenpunkte. Die Datenerweiterung wird hauptsächlich verwendet, um den Trainingsdatensatz zu erweitern und den Datensatz so vielfältig wie möglich zu gestalten, sodass das trainierte Modell über eine stärkere Generalisierungsfähigkeit verfügt. Alle wichtigen bestehenden Deep-Learning-Frameworks verfügen bereits über eine Datenerweiterung.
Szenarien für die Verwendung der Datenerweiterung
- Verhindern Sie eine Überanpassung des Modells.
- Der anfängliche Trainingssatz ist zu klein.
- Um die Modellgenauigkeit zu verbessern.
- Reduzieren Sie die Betriebskosten für die Kennzeichnung und Bereinigung von Rohdatensätzen.
Einschränkungen der Datenerweiterung
- Die Verzerrungen im ursprünglichen Datensatz sind in den erweiterten Daten weiterhin vorhanden.
- Die Qualitätssicherung für die Datenerweiterung ist kostspielig.
- Um Systeme mit fortschrittlichen Anwendungen zu bauen, sind Forschung und Entwicklung erforderlich. Beispielsweise kann die Generierung hochauflösender Bilder mithilfe von GANs eine Herausforderung sein.
- Es kann eine Herausforderung sein, wirksame Methoden zur Datenerweiterung zu finden.