Command Palette
Search for a command to run...
Allgemeine E(2)-äquivariante steuerbare CNNs
Allgemeine E(2)-äquivariante steuerbare CNNs
Maurice Weiler Gabriele Cesa
Zusammenfassung
Der große empirische Erfolg gruppenäquivarianter Netze hat in den letzten Jahren zu einer Vielzahl neuartiger äquivarianter Netzarchitekturen geführt. Ein besonderer Fokus lag dabei auf Rotation- und Spiegelungsäquivarianten CNNs für ebene Bilder. In diesem Beitrag geben wir eine allgemeine Beschreibung von E(2)-äquivarianten Faltungen im Rahmen der Steerable CNNs. Die Theorie der Steerable CNNs liefert hierbei Einschränkungen für die Faltungskerne, die von den Gruppenrepräsentationen abhängen, welche die Transformationsgesetze der Merkmalsräume beschreiben. Wir zeigen, dass diese Einschränkungen für beliebige Gruppenrepräsentationen auf Einschränkungen bezüglich irreduzibler Darstellungen reduziert werden können. Für beliebige Darstellungen der euklidischen Gruppe E(2) und ihrer Untergruppen wird eine allgemeine Lösung der Kernelsraumbedingung angegeben. Wir implementieren eine breite Palette bisher vorgeschlagener und vollständig neuer äquivarianter Netzarchitekturen und vergleichen ihre Leistung umfassend. Darüber hinaus wird gezeigt, dass E(2)-steerable Faltungen bei der Verwendung als direkte Ersatzkomponente für nicht-äquivariante Faltungen erhebliche Verbesserungen auf den Datensätzen CIFAR-10, CIFAR-100 und STL-10 erzielen.