HyperAIHyperAI

Command Palette

Search for a command to run...

MobilePose: Echtzeit-Gestenerkennung für unbekannte Objekte mit schwacher Formüberwachung

Tingbo Hou Adel Ahmadyan Liangkai Zhang Jianing Wei Matthias Grundmann

Zusammenfassung

In diesem Paper behandeln wir das Problem der Erkennung bisher nicht gesehener Objekte anhand von RGB-Bildern sowie der Schätzung ihrer 3D-Pose. Wir stellen zwei mobilfreundliche Netzwerke vor: MobilePose-Base und MobilePose-Shape. Letzteres wird eingesetzt, wenn Formsupervision verfügbar ist – selbst wenn diese nur schwach ist – während MobilePose-Base für den Fall ohne Formsupervision vorgesehen ist. Wir überprüfen erneut die in früheren Methoden verwendeten Formmerkmale, darunter Segmentierung und Koordinatenkarten. Wir erklären, unter welchen Bedingungen und warum eine pixelgenaue Formsupervision die Schätzung der Pose verbessern kann. Aufgrund dieser Erkenntnisse integrieren wir die Vorhersage der Form als Zwischenschicht in MobilePose-Shape und ermöglichen es dem Netzwerk, die Pose aus der Form abzuleiten. Unsere Modelle werden auf einer Kombination aus realen und synthetischen Daten trainiert, wobei eine schwache und verrauschte Formsupervision verwendet wird. Die Modelle sind extrem leichtgewichtig und ermöglichen eine Echtzeit-Verarbeitung auf modernen Mobilgeräten (z. B. 36 FPS auf dem Galaxy S20). Im Vergleich zu vorherigen Ein-Schritt-Lösungen erreicht unsere Methode eine höhere Genauigkeit, während das Modell deutlich kleiner ist (2–3 % in Modellgröße oder Anzahl der Parameter).


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp