Réseaux de neurones CNN à orientation contrôlée $E(2)$-équivariants généraux

Le grand succès empirique des réseaux équivariants par rapport aux groupes a conduit, ces dernières années, à l’émergence d’une grande diversité d’architectures de réseaux équivariants. Un intérêt particulier s’est porté sur les réseaux convolutifs équivariants aux rotations et aux réflexions pour les images planes. Dans ce travail, nous présentons une description générale des convolutions équivariantes par rapport au groupe $E(2)$ dans le cadre des CNNs orientables (Steerable CNNs). La théorie des Steerable CNNs permet ainsi d’obtenir des contraintes sur les noyaux de convolution, qui dépendent des représentations du groupe décrivant les lois de transformation des espaces de caractéristiques. Nous montrons que ces contraintes, valables pour des représentations arbitraires du groupe, peuvent être réduites à des contraintes sous les représentations irréductibles. Une solution générale pour la contrainte sur l’espace des noyaux est fournie pour toute représentation du groupe euclidien $E(2)$ et de ses sous-groupes. Nous implémentons une large gamme d’architectures de réseaux équivariants proposées précédemment ainsi que de nouvelles architectures entièrement originales, et comparons de manière exhaustive leurs performances. En outre, nous démontrons que les convolutions orientables par rapport à $E(2)$ permettent d’obtenir des gains remarquables sur les jeux de données CIFAR-10, CIFAR-100 et STL-10 lorsqu’elles sont utilisées comme remplacement direct (drop-in) des convolutions non équivariantes.