PatchAugment: Lokale Nachbarschafts-Augmentierung bei der Punktwolken-Klassifikation

Rezent trainierte tiefen neuronalen Netzwerke, die auf kleineren und weniger vielfältigen Datensätzen basieren, nutzen Datenverstärkung (data augmentation), um Einschränkungen wie Überanpassung, reduzierte Robustheit und geringere Generalisierbarkeit zu mildern. Bei der Verarbeitung von 3D-Datensätzen gehören Methoden zur Datenverstärkung wie zufälliges Punktdrop, Skalierung, Translation, Rotationen und Jittering zu den gängigsten Ansätzen. Diese Techniken sind jedoch meist fest vorgegeben und werden typischerweise auf das gesamte Objekt angewendet, wodurch die lokale Geometrie des Objekts vernachlässigt wird. Unterschiedliche lokale Nachbarschaften auf der Objektoberfläche weisen unterschiedliche Grade an geometrischer Komplexität auf. Die Anwendung identischer Datenverstärkungstechniken auf Ebene des gesamten Objekts ist daher weniger effektiv bei der Verstärkung lokaler Bereiche mit komplexen Strukturen. In dieser Arbeit stellen wir PatchAugment vor, einen Datenverstärkungsrahmen, der unterschiedliche Verstärkungstechniken gezielt auf lokale Nachbarschaften anwendet. Unsere experimentellen Studien an den Modellen PointNet++ und DGCNN belegen die Wirksamkeit von PatchAugment bei der Aufgabe der 3D-Punktwolken-Klassifikation. Wir haben unsere Methode anhand vier Benchmark-Datensätze evaluiert: ModelNet40 (synthetisch), ModelNet10 (synthetisch), SHREC’16 (synthetisch) und ScanObjectNN (realistisch).