HyperAIHyperAI
vor 7 Tagen

Simple Copy-Paste ist eine starke Daten-Augmentierungsmethode für die Objektsegmentierung

Golnaz Ghiasi, Yin Cui, Aravind Srinivas, Rui Qian, Tsung-Yi Lin, Ekin D. Cubuk, Quoc V. Le, Barret Zoph
Simple Copy-Paste ist eine starke Daten-Augmentierungsmethode für die Objektsegmentierung
Abstract

Die Entwicklung dateneffizienter Instanzsegmentierungsmodelle, die auch seltene Objektkategorien gut verarbeiten können, stellt eine zentrale Herausforderung im Bereich des Computersehens dar. Die Nutzung von Datenaugmentierungen erscheint hier als vielversprechender Ansatz zur Bewältigung dieser Herausforderung. In dieser Arbeit führen wir eine systematische Untersuchung der Copy-Paste-Augmentierung ([13, 12]) für die Instanzsegmentierung durch, bei der Objekte zufällig auf ein Bild gelegt werden. Bisherige Studien zur Copy-Paste-Methode basierten auf der Modellierung der visuellen Umgebung, um die Objekte plausibel einzufügen. Wir zeigen jedoch, dass die einfache Methode des zufälligen Einfügens von Objekten bereits ausreichend ist und signifikante Verbesserungen gegenüber starken Baseline-Modellen erzielt. Darüber hinaus belegen wir, dass Copy-Paste kompatibel und additiv mit semi-supervised Methoden ist, die zusätzliche Daten durch Pseudolabeling (z. B. Self-Training) nutzen. Auf dem COCO-Datensatz für Instanzsegmentierung erreichen wir eine Masken-AP von 49,1 und eine Box-AP von 57,3 – eine Verbesserung um +0,6 Masken-AP und +1,5 Box-AP gegenüber dem vorherigen Stand der Technik. Zudem demonstrieren wir, dass Copy-Paste erhebliche Leistungssteigerungen auf dem LVIS-Benchmark ermöglicht. Unser Baselinemodell erreicht auf seltenen Kategorien eine Masken-AP, die um +3,6 gegenüber dem Gewinnerbeitrag des LVIS 2020 Challenge übertrifft.

Simple Copy-Paste ist eine starke Daten-Augmentierungsmethode für die Objektsegmentierung | Neueste Forschungsarbeiten | HyperAI