Allgemeine $E(2)$-äquivariante steuerbare CNNs

Der große empirische Erfolg gruppenäquivalenter Netzwerke hat in den letzten Jahren zu einer Vielzahl neuartiger äquivalenter Netzarchitekturen geführt. Besonderes Augenmerk wurde dabei auf Rotation- und Spiegelungsäquivalente CNNs für ebene Bilder gelegt. In diesem Beitrag geben wir eine allgemeine Beschreibung von $E(2)$-äquivalenten Faltungen im Rahmen der Steerable CNNs. Die Theorie der Steerable CNNs liefert hierbei Einschränkungen für die Faltungskerne, die von Gruppenrepräsentationen abhängen, welche die Transformationsgesetze der Merkmalsräume beschreiben. Wir zeigen, dass diese Einschränkungen für beliebige Gruppenrepräsentationen auf Einschränkungen bezüglich irreduzibler Darstellungen reduziert werden können. Für beliebige Darstellungen der euklidischen Gruppe $E(2)$ und ihrer Untergruppen wird eine allgemeine Lösung des Kernelsraumconstraints bereitgestellt. Wir implementieren eine breite Palette bisher vorgeschlagener sowie vollständig neuer äquivalenter Netzarchitekturen und vergleichen ihre Leistung umfassend. Darüber hinaus wird gezeigt, dass $E(2)$-steerable Faltungen bei Einsatz als direkte Ersatzkomponente für nicht-äquivalente Faltungen erhebliche Verbesserungen auf CIFAR-10, CIFAR-100 und STL-10 erzielen.