Geometrisches Deep Learning auf Graphen und Mannigfaltigkeiten mit Mischungsmodell-CNNs

Tiefes Lernen hat in mehreren Bereichen eine bemerkenswerte Leistungssteigerung erzielt, insbesondere in der Spracherkennung, der natürlichsprachlichen Verarbeitung und der Computer Vision. Insbesondere erzeugen aktuelle Architekturen von Faltungsneuronalen Netzen (CNN) den Stand der Technik bei einer Vielzahl von Bildanalyseaufgaben wie Objekterkennung und -detektion. Die meisten Forschungen im Bereich des tiefen Lernens haben sich bisher auf die Bearbeitung euklidischer strukturierter Daten konzentriert, wie akustische Signale, Bilder oder Videos. Kürzlich hat sich jedoch ein wachsendes Interesse an geometrischem tiefem Lernen entwickelt, das versucht, Methoden des tiefen Lernens auf nicht-euklidische strukturierte Daten wie Graphen und Mannigfaltigkeiten zu verallgemeinern, mit einer Vielzahl von Anwendungen aus den Bereichen Netzwerkanalyse, Computational Social Science oder Computergrafik. In dieser Arbeit schlagen wir einen einheitlichen Rahmen vor, der es ermöglicht, CNN-Architekturen auf nicht-euklidische Domains (Graphen und Mannigfaltigkeiten) zu verallgemeinern und lokale, stationäre und zusammengesetzte taskspezifische Merkmale zu lernen. Wir zeigen, dass verschiedene nicht-euklidische CNN-Methoden, die bisher in der Literatur vorgeschlagen wurden, als spezielle Instanzen unseres Rahmens betrachtet werden können. Wir testen die vorgeschlagene Methode an Standardaufgaben aus den Bereichen Bild-, Graph- und 3D-Formanalyse und zeigen, dass sie konsistent bessere Ergebnisse als frühere Ansätze liefert.