HyperAIHyperAI
vor 17 Tagen

HandAugment: Eine einfache Daten-Augmentierungsmethode für die tiefenbasierte 3D-Handpose-Schätzung

Zhaohui Zhang, Shipeng Xie, Mingxiu Chen, Haichao Zhu
HandAugment: Eine einfache Daten-Augmentierungsmethode für die tiefenbasierte 3D-Handpose-Schätzung
Abstract

Die Schätzung der Handpose aus 3D-Tiefenbildern wurde in der Computer Vision-Forschung weitgehend mit verschiedenen Techniken untersucht. Obwohl neuere Methoden auf Basis tiefer neuronaler Netze die Leistung erheblich verbessert haben, bleibt dieses Problem weiterhin ungelöst, da fehlen große Datensätze wie ImageNet oder effektive Methoden zur Datensynthese. In diesem Paper stellen wir HandAugment vor, eine Methode zur Synthese von Bilddaten, um den Trainingsprozess neuronaler Netze zu erweitern. Unser Ansatz besteht aus zwei Hauptkomponenten: Erstens schlagen wir ein zweistufiges Netzwerk-Schema vor, das es den neuronalen Netzen ermöglicht, sich auf die Handregionen zu konzentrieren und somit die Leistung zu steigern. Zweitens führen wir eine einfache und effektive Methode zur Datensynthese ein, indem reale und synthetische Bilder im Bilddarstellungsraum kombiniert werden. Abschließend zeigen wir, dass unsere Methode beim HANDS 2019-Wettbewerb zur 3D-Handpose-Schätzung auf der Grundlage von Tiefenbildern den ersten Platz belegte.

HandAugment: Eine einfache Daten-Augmentierungsmethode für die tiefenbasierte 3D-Handpose-Schätzung | Neueste Forschungsarbeiten | HyperAI