MLGCN: Multi-Laplacian Graph Convolutional Networks für die Menschliche Aktenerkennung
Convolutional Neural Networks erleben derzeit einen bedeutenden Erfolg bei verschiedenen Aufgaben der Mustererkennung. Diese Lernmodelle wurden ursprünglich für vektorielle Daten wie Bilder konzipiert, doch deren Erweiterung auf nicht-vektoriale und halbstrukturierte Daten – insbesondere Graphen mit variabler Größe, Topologie usw. – bleibt eine große Herausforderung, obwohl derzeit einige vielversprechende Lösungen entstehen. In diesem Artikel stellen wir MLGCN vor: ein neuartiges spektrales Multi-Laplacian-Graph-Convolutional Network. Der zentrale Beitrag dieser Methode liegt in einem neuen Designprinzip, das Graph-Laplacian-Matrizen als konvexe Kombinationen einfacher, elementarer Laplacian-Matrizen lernt – wobei jeder dieser Basis-Laplacianen einer spezifischen Topologie der Eingabegraphen zugeordnet ist. Zudem führen wir einen neuartigen Pooling-Operator für Graphen ein, der in zwei Schritten arbeitet: Zunächst erfolgt eine kontextabhängige Erweiterung der Knoten, gefolgt von einer globalen Durchschnittspooling-Operation. Die Stärke dieses zweistufigen Prozesses liegt in seiner Fähigkeit, die Diskriminativkraft der Knoten zu bewahren, gleichzeitig jedoch Permutationsinvarianz zu gewährleisten. Experimente an den Datensätzen SBU und UCF-101 bestätigen die Wirksamkeit unserer Methode für die anspruchsvolle Aufgabe der Aktenerkennung.Zusatzmaterial: https://bit.ly/2ku2lYv