Fourier-Net : Enregistrement d'images rapide avec déformation à bande limitée

L'enregistrement d'images non supervisé utilise couramment des réseaux de type U-Net pour prédire des champs de déplacement dense dans le domaine spatial à pleine résolution. Pour les données d'images volumiques à haute résolution, ce processus est cependant très gourmand en ressources et chronophage. Pour résoudre ce problème, nous proposons Fourier-Net, qui remplace la partie expansive d'un réseau de type U-Net par un décodeur piloté par modèle sans paramètre. Plus précisément, au lieu que notre Fourier-Net apprenne à produire un champ de déplacement à pleine résolution dans le domaine spatial, nous apprenons sa représentation de faible dimension dans un domaine de Fourier à bande limitée. Cette représentation est ensuite décodée par notre décodeur piloté par modèle conçu (composé d'une couche de remplissage nul et d'une couche de transformée de Fourier discrète inverse) vers le champ de déplacement dense à pleine résolution dans le domaine spatial. Ces modifications permettent à notre Fourier-Net non supervisé de contenir moins de paramètres et d'opérations computationnelles, aboutissant ainsi à des vitesses d'inférence plus rapides. Fourier-Net est ensuite évalué sur deux jeux de données cérébraux 3D publics face à diverses approches de pointe. Par exemple, comparé à une méthode récente basée sur les transformers, nommée TransMorph, notre Fourier-Net, qui utilise seulement 2,2\% de ses paramètres et 6,66\% des opérations multiplicatives-additives, obtient un score Dice 0,5\% plus élevé et une vitesse d'inférence 11,48 fois plus rapide. Le code source est disponible sur \url{https://github.com/xi-jia/Fourier-Net}.