QTSeg : Un cadre de attention dual-mix basé sur des jetons de requête avec une distribution de caractéristiques multi-niveaux pour la segmentation d'images médicales

La segmentation d'images médicales joue un rôle crucial pour aider les professionnels de la santé à poser des diagnostics précis et pour permettre des processus de diagnostic automatisés. Les réseaux neuronaux convolutifs traditionnels (CNNs) ont souvent du mal à capturer les dépendances à longue portée, tandis que les architectures basées sur les transformateurs, bien qu'efficaces, sont accompagnées d'une complexité computationnelle accrue. Les efforts récents se sont concentrés sur la combinaison des CNNs et des transformateurs pour équilibrer performance et efficacité, mais les approches existantes continuent de faire face à des défis dans l'obtention d'une haute précision de segmentation tout en maintenant des coûts computationnels faibles. De plus, de nombreuses méthodes sous-explorent la capacité de l'encodeur CNN à capturer les informations spatiales locales, se concentrant principalement sur l'atténuation des problèmes de dépendances à longue portée. Pour remédier à ces limitations, nous proposons QTSeg, une nouvelle architecture pour la segmentation d'images médicales qui intègre efficacement les informations locales et globales. QTSeg présente un décodeur à double attention mixte conçu pour améliorer la performance de segmentation par : (1) un mécanisme d'attention croisée pour une meilleure alignement des caractéristiques, (2) un module d'attention spatiale pour capturer les dépendances à longue portée, et (3) un bloc d'attention canal pour apprendre les relations inter-canales. De plus, nous introduisons un module de distribution de caractéristiques multiniveau, qui équilibre adaptativement la propagation des caractéristiques entre l'encodeur et le décodeur, ce qui améliore encore davantage la performance. Des expériences approfondies sur cinq jeux de données publiquement disponibles couvrant diverses tâches de segmentation, notamment la segmentation de lésions, de polypes, du cancer du sein, de cellules et de vaisseaux rétiniens, montrent que QTSeg surpassent les méthodes actuelles dans plusieurs métriques d'évaluation tout en maintenant des coûts computationnels inférieurs. Notre implémentation peut être trouvée à : https://github.com/tpnam0901/QTSeg (v1.0.0)