MLGCN: Multi-Laplacian Graph Convolutional Networks für die Menschliche Aktenerkennung
{Hichem Sahbi Ahmed Mazari}
Abstract
Convolutional Neural Networks erleben derzeit einen bedeutenden Erfolg bei verschiedenen Aufgaben der Mustererkennung. Diese Lernmodelle wurden ursprünglich für vektorielle Daten wie Bilder konzipiert, doch deren Erweiterung auf nicht-vektoriale und halbstrukturierte Daten – insbesondere Graphen mit variabler Größe, Topologie usw. – bleibt eine große Herausforderung, obwohl derzeit einige vielversprechende Lösungen entstehen. In diesem Artikel stellen wir MLGCN vor: ein neuartiges spektrales Multi-Laplacian-Graph-Convolutional Network. Der zentrale Beitrag dieser Methode liegt in einem neuen Designprinzip, das Graph-Laplacian-Matrizen als konvexe Kombinationen einfacher, elementarer Laplacian-Matrizen lernt – wobei jeder dieser Basis-Laplacianen einer spezifischen Topologie der Eingabegraphen zugeordnet ist. Zudem führen wir einen neuartigen Pooling-Operator für Graphen ein, der in zwei Schritten arbeitet: Zunächst erfolgt eine kontextabhängige Erweiterung der Knoten, gefolgt von einer globalen Durchschnittspooling-Operation. Die Stärke dieses zweistufigen Prozesses liegt in seiner Fähigkeit, die Diskriminativkraft der Knoten zu bewahren, gleichzeitig jedoch Permutationsinvarianz zu gewährleisten. Experimente an den Datensätzen SBU und UCF-101 bestätigen die Wirksamkeit unserer Methode für die anspruchsvolle Aufgabe der Aktenerkennung.Zusatzmaterial: https://bit.ly/2ku2lYv
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| action-recognition-in-videos-on-ucf101 | MLGCN | 3-fold Accuracy: 63.27 |
| skeleton-based-action-recognition-on-sbu | MLGCN | Accuracy: 98.60% |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.