HyperAIHyperAI

Command Palette

Search for a command to run...

Raum-Zeit-Multi-Cue-Netzwerk für die kontinuierliche Gebärdensprachenerkennung

Hao Zhou Wengang Zhou Yun Zhou Houqiang Li

Zusammenfassung

Trotz des jüngsten Erfolgs von Deep Learning bei der kontinuierlichen Gebärdenspracheerkennung (CSLR) konzentrieren sich tiefe Modelle typischerweise auf die diskriminativsten Merkmale und ignorieren andere potenziell nicht-triviale und informative Inhalte. Diese Eigenschaft begrenzt ihre Fähigkeit erheblich, implizite visuelle Grammatiken hinter der Zusammenarbeit verschiedener visueller Hinweise (z. B. Handform, Gesichtsausdruck und Körperhaltung) zu erlernen. Durch die Integration von Multi-Cue-Lernen in den Entwurf neuronalen Netzwerks schlagen wir ein räumlich-zeitliches Multi-Cue (STMC)-Netzwerk zur Lösung des sequenzbasierten Sichtproblems vor. Unser STMC-Netzwerk besteht aus einem räumlichen Multi-Cue (SMC)-Modul und einem zeitlichen Multi-Cue (TMC)-Modul. Das SMC-Modul ist der räumlichen Repräsentation gewidmet und zerlegt explizit visuelle Merkmale verschiedener Hinweise mithilfe eines eigenständigen Pose-Schätzungszweigs. Das TMC-Modul modelliert zeitliche Korrelationen entlang zweier paralleler Pfade, nämlich intra-Cue und inter-Cue, um die Einzigartigkeit der einzelnen Hinweise zu bewahren und deren Zusammenarbeit zu erforschen. Schließlich entwerfen wir eine gemeinsame Optimierungsstrategie, um den end-to-end-Sequenzlernprozess des STMC-Netzwerks zu realisieren. Zur Validierung der Wirksamkeit führen wir Experimente auf drei großen CSLR-Benchmark-Datenbanken durch: PHOENIX-2014, CSL und PHOENIX-2014-T. Die experimentellen Ergebnisse zeigen, dass die vorgeschlagene Methode auf allen drei Benchmarks neue State-of-the-Art-Leistungen erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp