Fourier-Net: Schnelle Bildregistrierung mit bandbegrenzter Deformation

Die unüberwachte Bildregistrierung verwendet häufig Netzwerke im Stil von U-Net, um dichte Verschiebungsfelder im vollen räumlichen Auflösungsvermögen vorherzusagen. Für hochaufgelöste volumetrische Bilddaten ist dieser Prozess jedoch ressourcenintensiv und zeitaufwendig. Um dieses Problem zu lösen, schlagen wir das Fourier-Net vor, bei dem der expansive Pfad eines U-Net-stiligen Netzwerks durch einen modellgetriebenen Decoder ohne Parameter ersetzt wird. Insbesondere lernt unser Fourier-Net nicht, ein dichtes Verschiebungsfeld im vollen räumlichen Auflösungsvermögen auszugeben, sondern seine niedrigdimensionale Darstellung in einem bandbegrenzten Fourier-Bereich. Diese Darstellung wird dann durch unseren entwickelten modellgetriebenen Decoder (bestehend aus einer Null-Padding-Schicht und einer inversen diskreten Fourier-Transformationsschicht) in das dichte, voll aufgelöste Verschiebungsfeld im räumlichen Bereich decodiert. Diese Änderungen ermöglichen es unserem unüberwachten Fourier-Net, weniger Parameter und Rechenoperationen zu haben, was zu schnelleren Inferenzgeschwindigkeiten führt. Das Fourier-Net wurde dann anhand zweier öffentlicher 3D-Gehirndatensätze gegenüber verschiedenen Stand-of-the-Art-Ansätzen evaluiert. Zum Beispiel erreicht unser Fourier-Net bei Vergleich mit einer kürzlich veröffentlichten transformer-basierten Methode namens TransMorph, die nur 2,2 % ihrer Parameter und 6,66 % der Multiplikations-Additionsoperationen verwendet, einen 0,5 % höheren Dice-Wert und eine Inferenzgeschwindigkeit, die 11,48-mal schneller ist. Der Quellcode ist unter \url{https://github.com/xi-jia/Fourier-Net} verfügbar.