Command Palette
Search for a command to run...
HandAugment: Eine einfache Daten-Augmentierungsmethode für die tiefenbasierte 3D-Handpose-Schätzung
HandAugment: Eine einfache Daten-Augmentierungsmethode für die tiefenbasierte 3D-Handpose-Schätzung
Zhaohui Zhang Shipeng Xie Mingxiu Chen Haichao Zhu
Zusammenfassung
Die Schätzung der Handpose aus 3D-Tiefenbildern wurde in der Computer Vision-Forschung weitgehend mit verschiedenen Techniken untersucht. Obwohl neuere Methoden auf Basis tiefer neuronaler Netze die Leistung erheblich verbessert haben, bleibt dieses Problem weiterhin ungelöst, da fehlen große Datensätze wie ImageNet oder effektive Methoden zur Datensynthese. In diesem Paper stellen wir HandAugment vor, eine Methode zur Synthese von Bilddaten, um den Trainingsprozess neuronaler Netze zu erweitern. Unser Ansatz besteht aus zwei Hauptkomponenten: Erstens schlagen wir ein zweistufiges Netzwerk-Schema vor, das es den neuronalen Netzen ermöglicht, sich auf die Handregionen zu konzentrieren und somit die Leistung zu steigern. Zweitens führen wir eine einfache und effektive Methode zur Datensynthese ein, indem reale und synthetische Bilder im Bilddarstellungsraum kombiniert werden. Abschließend zeigen wir, dass unsere Methode beim HANDS 2019-Wettbewerb zur 3D-Handpose-Schätzung auf der Grundlage von Tiefenbildern den ersten Platz belegte.