HyperAIHyperAI

Command Palette

Search for a command to run...

Zur Nutzen von 3D-Handpose für die Aktionserkennung

Md Salman Shamil Dibyadip Chatterjee Fadime Sener Shugao Ma Angela Yao

Zusammenfassung

Die 3D-Handhaltung ist ein noch unterrepräsentierte Modalität für die Aktionserkennung. Haltungen sind kompakt und dennoch informativ und können Anwendungen mit begrenzten Rechenressourcen erheblich nutzen. Allerdings bieten Haltungen allein ein unvollständiges Verständnis von Aktionen, da sie nicht vollständig Objekte und Umgebungen erfassen können, mit denen Menschen interagieren. Wir schlagen HandFormer vor, einen neuen multimodalen Transformer, um Hand-Objekt-Interaktionen effizient zu modellieren. HandFormer kombiniert 3D-Handhaltungen mit hoher zeitlicher Auflösung für eine feingranulare Bewegungsmodellierung mit dünn besetzten RGB-Bildern zur Kodierung der Szenensemantik. Indem wir die einzigartigen Merkmale von Handhaltungen betrachten, faktorisieren wir die Modellierung der Hände zeitlich und stellen jeden Gelenk durch seine kurzfristigen Trajektorien dar. Diese faktorisierte Haltungsrepräsentation in Kombination mit dünn besetzten RGB-Proben ist bemerkenswert effizient und hochgenau. Ein unimodaler HandFormer, der nur auf Handhaltungen basiert, übertrifft bestehende skeletonbasierte Methoden bei einem Fünftel der FLOPs (floating point operations). Mit RGB-Bildern erreichen wir neue Standesbestleistungen (state-of-the-art) auf Assembly101 und H2O, wobei sich das Leistungsniveau bei der egozentrischen Aktionserkennung erheblich verbessert hat.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp