HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Gemeinsames Lernen heterogener Merkmale für die RGB-D-Aktivitätserkennung

{Jian-Guo Zhang Jian-Huang Lai Wei-Shi Zheng Jian-Fang Hu}

Gemeinsames Lernen heterogener Merkmale für die RGB-D-Aktivitätserkennung

Abstract

In diesem Paper konzentrieren wir uns auf die Lernung heterogener Merkmale für die Aktivitätserkennung mit RGB-D-Daten. Wir beobachten, dass Merkmale aus verschiedenen Kanälen (RGB, Tiefenbild) bestimmte ähnliche verborgene Strukturen aufweisen können, und schlagen daher ein gemeinsames Lernmodell vor, das gleichzeitig die gemeinsamen und kanalspezifischen Komponenten als Spezialfall der heterogenen Mehraufgaben-Lernung untersucht. Das vorgeschlagene Modell, das in einem einheitlichen Rahmen formuliert ist, ermöglicht: 1) die gleichzeitige Exploration einer Reihe von Unterräumen mit gleicher Dimension, um latente gemeinsame Merkmale über verschiedene Merkmalskanäle hinweg auszunutzen; 2) gleichzeitig die Quantifizierung der gemeinsamen und kanalspezifischen Komponenten der Merkmale innerhalb dieser Unterräume; sowie 3) die Übertragung kanalspezifischer Zwischentransformationen (i-Transformations) zur Lernung der Fusion heterogener Merkmale über verschiedene Datensätze hinweg. Um das gemeinsame Modell effizient zu trainieren, wird ein dreistufiger iterativer Optimierungsalgorithmus vorgeschlagen, gefolgt von einem einfachen Inferenzmodell. Umfangreiche experimentelle Ergebnisse auf vier Aktivitätsdatensätzen belegen die Wirksamkeit des vorgeschlagenen Ansatzes. Zudem wird ein neuer RGB-D-Datensatz zur Aktivitätserkennung mit Fokus auf mensch-objekt-Interaktion vorgestellt, der zusätzliche Herausforderungen für die Benchmarking-Aktivitätsanalyse mit RGB-D-Daten darstellt.

Benchmarks

BenchmarkMethodikMetriken
skeleton-based-action-recognition-on-ntu-rgbdDynamic Skeletons
Accuracy (CS): 60.2
Accuracy (CV): 65.2
skeleton-based-action-recognition-on-ntu-rgbd-1Dynamic Skeletons
Accuracy (Cross-Setup): 54.7%
Accuracy (Cross-Subject): 50.8%
skeleton-based-action-recognition-on-sysu-3dDynamic Skeletons
Accuracy: 75.5%

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Gemeinsames Lernen heterogener Merkmale für die RGB-D-Aktivitätserkennung | Forschungsarbeiten | HyperAI