Transformers sensibles aux frontières pour la segmentation des lésions cutanées

La segmentation des lésions cutanées à partir d’images de dermatoscopie revêt une importance capitale pour améliorer l’analyse quantitative du cancer de la peau. Toutefois, la segmentation automatique des mélanomes constitue une tâche extrêmement difficile en raison de la grande variabilité des mélanomes et des limites floues des zones lésionnelles. Bien que les réseaux de neurones convolutifs (CNN) aient atteint des progrès remarquables dans ce domaine, la plupart des solutions existantes demeurent incapables de capturer efficacement les dépendances globales afin de contrer le biais inductif résultant de champs réceptifs limités. Récemment, les transformateurs ont été proposés comme un outil prometteur pour la modélisation du contexte global grâce à un mécanisme d’attention globale puissant. Toutefois, l’un de leurs principaux inconvénients lorsqu’ils sont appliqués aux tâches de segmentation réside dans leur incapacité à extraire efficacement des détails locaux suffisants pour traiter les frontières ambigües. Nous proposons un nouveau transformateur sensible aux frontières (Boundary-aware Transformer, BAT) afin de répondre de manière globale aux défis posés par la segmentation automatique des lésions cutanées. Plus précisément, nous intégrons une nouvelle porte d’attention par zone frontière (Boundary-wise Attention Gate, BAG) dans les transformateurs, permettant au réseau entier de modéliser non seulement efficacement les dépendances à longue portée grâce aux transformateurs, mais aussi, simultanément, de capter davantage de détails locaux en exploitant pleinement les connaissances a priori liées aux frontières. En particulier, la supervision auxiliaire fournie par la BAG aide les transformateurs à apprendre des embeddings de position, car elle fournit une information spatiale considérable. Nous avons mené des expériences approfondies pour évaluer le BAT proposé, et les résultats expérimentaux confirment son efficacité, dépassant de manière cohérente les méthodes de pointe sur deux jeux de données célèbres.