Réseaux pour l'enregistrement d'images conjointement affine et non paramétrique

Nous présentons un cadre de deep learning intégral pour l'enregistrement d'images médicales 3D. Contrairement aux approches existantes, notre cadre combine deux méthodes d'enregistrement : une enregistrement affine et un modèle de champ de vitesse stationnaire paramétré par un vecteur moment (vSVF). Plus précisément, il se compose de trois étapes. Dans la première étape, un réseau affine à plusieurs étapes prédit les paramètres de transformation affine. Dans la deuxième étape, nous utilisons un réseau de type Unet pour générer un moment, à partir duquel un champ de vitesse peut être calculé par lissage. Enfin, dans la troisième étape, nous mettons en œuvre une composante vSVF basée sur une carte auto-itérable pour fournir une amélioration non paramétrique basée sur l'estimation actuelle de la carte de transformation. Une fois le modèle entraîné, l'enregistrement est effectué en une seule passe avant. Pour évaluer les performances, nous avons mené des expériences longitudinales et inter-sujets sur des images par résonance magnétique (IRM) 3D du genou issues du jeu de données Osteoarthritis Initiative (OAI). Les résultats montrent que notre cadre atteint des performances comparables à celles des approches les plus avancées d'enregistrement d'images médicales, mais qu'il est beaucoup plus rapide, avec un meilleur contrôle de la régularité des transformations, y compris la capacité de produire des transformations approximativement symétriques, et en combinant l'enregistrement affine et non paramétrique.