Réseau de régistration d’images déformables récursif avec attention mutuelle

L’alignement d’images déformables, qui consiste à estimer la transformation spatiale entre différentes images, constitue une tâche essentielle en imagerie médicale. De nombreuses études antérieures ont adopté des méthodes fondées sur l’apprentissage pour réaliser un alignement multi-étapes en 3D, afin d’améliorer les performances. Toutefois, les approches multi-étapes sont limitées par la taille du champ réceptif, ce qui empêche une modélisation adéquate des mouvements complexes qui ne se manifestent pas à une seule échelle spatiale. Nous proposons un nouveau réseau d’alignement combinant une architecture récursive et un mécanisme d’attention mutuelle afin de surmonter ces contraintes. Par rapport aux méthodes d’apprentissage profond les plus avancées, notre réseau basé sur une structure récursive atteint la plus haute précision sur le jeu de données pulmonaires en tomographie par ordinateur (CT), avec un score Dice de 92 % et une distance moyenne aux surfaces de 3,8 mm pour les poumons, ainsi qu’un des résultats les plus précis sur le jeu de données abdominales en CT incluant 9 organes de tailles variées (score Dice de 55 % et distance moyenne aux surfaces de 7,8 mm). Nous démontrons également qu’il suffit d’intégrer 3 réseaux récursifs pour atteindre des performances de pointe, sans toutefois entraîner une augmentation significative du temps de déduction.