HyperAIHyperAI

Command Palette

Search for a command to run...

Raumbezogene Aufmerksamkeitsgesteuerte 3D-Graph-Convolutional Neural Network für die Gebärdenspracherkennung

Zusammenfassung

Die Gebärdensprache ist der Hauptkanal für hörgeschädigte Menschen, um mit anderen zu kommunizieren. Sie ist eine visuelle Sprache, die hochstrukturierte Komponenten aus manuellen und nicht-manuellen Parametern vermittelt, weshalb sie für hörende Menschen eine erhebliche Lernanstrengung erfordert. Die Gebärdenerkennung zielt darauf ab, diese Lernschwierigkeit zu verringern und die Kommunikationslücke zwischen hörgeschädigten Personen und anderen zu schließen. Diese Studie präsentiert eine effiziente Architektur für die Gebärdenerkennung basierend auf einem convolutionalen Graph Neural Network (GCN). Die vorgestellte Architektur besteht aus einer geringen Anzahl separabler 3D-GCN-Schichten, die durch eine räumliche Aufmerksamkeitsmechanismus verbessert werden. Die begrenzte Anzahl von Schichten in der vorgeschlagenen Architektur ermöglicht es, das häufige Problem der Überglättung in tiefen Graph Neural Networks zu vermeiden. Zudem verstärkt der Aufmerksamkeitsmechanismus die räumliche Kontextdarstellung der Gesten. Die vorgeschlagene Architektur wurde auf verschiedenen Datensätzen evaluiert und zeigt herausragende Ergebnisse.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Raumbezogene Aufmerksamkeitsgesteuerte 3D-Graph-Convolutional Neural Network für die Gebärdenspracherkennung | Paper | HyperAI