HyperAIHyperAI

Command Palette

Search for a command to run...

Multi-GAT: Ein hierarchischer multimodaler Darstellungslearnansatz auf Basis graphischer Aufmerksamkeit für die Aktivitätserkennung beim Menschen

Tariq Iqbal Md Mofijul Islam

Zusammenfassung

Die Erkennung menschlicher Aktivitäten ist eine entscheidende Fähigkeit, die ein Roboter besitzen muss, um in menschlicher Umgebung nützlich zu sein. Obwohl moderne Roboter mit verschiedenen Sensorarten ausgestattet sind, bleibt die Erkennung menschlicher Aktivitäten (Human Activity Recognition, HAR) weiterhin eine herausfordernde Aufgabe, insbesondere bei Vorliegen von störenden Sensor-Daten. In dieser Arbeit stellen wir einen multimodalen, grafikbasierten Aufmerksamkeitsansatz zur HAR vor, genannt Multi-GAT, der hierarchisch ergänzende multimodale Merkmale lernt. Wir entwickeln ein multimodales Mixture-of-Experts-Modell, um modality-spezifische, herausragende Merkmale zu entkoppeln und zu extrahieren, wodurch Merkmalsinteraktionen ermöglicht werden. Zudem führen wir einen neuartigen, auf Nachrichtenübertragung basierenden grafischen Aufmerksamkeitsansatz ein, um Kreuzmodale Beziehungen zu erfassen und ergänzende multimodale Merkmale zu extrahieren. Die experimentellen Ergebnisse auf zwei multimodalen Datensätzen zur menschlichen Aktivitätserkennung zeigen, dass Multi-GAT alle getesteten State-of-the-Art-Algorithmen in Bezug auf alle verwendeten Datensätze und Metriken übertrifft. Schließlich belegen die Experimente mit gestörten Sensor-Daten, dass Multi-GAT konsistent alle verglichenen Baselines übertrifft. Die robuste Leistung unterstreicht, dass Multi-GAT eine nahtlose menschliche Roboter-Kooperation auch in störanfälligen Umgebungen ermöglichen kann.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Multi-GAT: Ein hierarchischer multimodaler Darstellungslearnansatz auf Basis graphischer Aufmerksamkeit für die Aktivitätserkennung beim Menschen | Paper | HyperAI