HyperAIHyperAI

Command Palette

Search for a command to run...

Dynamic GCN: kontextbereicherte Topologie-Lernverfahren für die Aktionserkennung basierend auf Skelettdaten

Fanfan Ye Shiliang Pu Qiaoyong Zhong Chao Li Di Xie Huiming Tang

Zusammenfassung

Graph Convolutional Networks (GCNs) haben zunehmend Interesse für die Aufgabe der aktionsbasierten Erkennung anhand von Skelettdaten hervorgerufen. Der Schlüssel hierbei liegt in der Gestaltung der Graphstruktur, welche Informationen über die Skeletttopologie kodiert. In diesem Artikel stellen wir Dynamic GCN vor, bei dem ein neuartiges convolutionales neuronales Netzwerk namens Context-Encoding Network (CeN) eingeführt wird, um die Skeletttopologie automatisch zu lernen. Insbesondere werden bei der Modellierung der Abhängigkeit zwischen zwei Gelenken kontextuelle Merkmale aus den verbleibenden Gelenken global berücksichtigt. CeN ist äußerst leichtgewichtig, dennoch hochwirksam und kann nahtlos in eine graphische Faltungs-Schicht integriert werden. Durch Stapeln mehrerer CeN-erweiterter graphischer Faltungs-Schichten konstruieren wir Dynamic GCN. Besonders hervorzuheben ist, dass CeN es ermöglicht, dynamische Graphtopologien sowohl für unterschiedliche Eingabeproben als auch für graphische Faltungs-Schichten verschiedener Tiefe zu generieren. Darüber hinaus werden drei alternative Architekturen zur Kontextmodellierung gründlich untersucht, die als Leitfaden für zukünftige Forschung im Bereich der Graph-Topologie-Lernung dienen können. CeN verursacht lediglich etwa 7 % zusätzliche FLOPs im Vergleich zum Basismodell, während Dynamic GCN eine bessere Leistung erzielt und dabei 2× bis 4× weniger FLOPs als bestehende Methoden benötigt. Durch die weitere Kombination statischer physischer Körperverbindungen mit Bewegungsmodalitäten erreichen wir state-of-the-art Ergebnisse auf drei großen Benchmarks: NTU-RGB+D, NTU-RGB+D 120 und Skeleton-Kinetics.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Dynamic GCN: kontextbereicherte Topologie-Lernverfahren für die Aktionserkennung basierend auf Skelettdaten | Paper | HyperAI