HyperAIHyperAI
il y a 2 mois

Segmentation d'images médicales à l'aide de transformateurs de compression et d'expansion

Shaohua Li; Xiuchao Sui; Xiangde Luo; Xinxing Xu; Yong Liu; Rick Goh
Segmentation d'images médicales à l'aide de transformateurs de compression et d'expansion
Résumé

La segmentation d'images médicales est essentielle pour le diagnostic assisté par ordinateur. Une bonne segmentation exige que le modèle puisse voir à la fois l'ensemble et les détails fins, c'est-à-dire apprendre des caractéristiques d'image qui intègrent un grand contexte tout en maintenant de hautes résolutions spatiales. Pour atteindre cet objectif, les méthodes les plus largement utilisées -- U-Net et ses variantes -- extraient et fusionnent des caractéristiques multi-échelles. Cependant, les caractéristiques fusionnées ont encore de petits « champs récepteurs efficaces » se concentrant sur des indices locaux d'image, ce qui limite leurs performances. Dans cette étude, nous proposons Segtran, une alternative au cadre de segmentation basée sur les transformateurs, qui possèdent des « champs récepteurs efficaces » illimités même à des résolutions de caractéristiques élevées. Le cœur de Segtran est un nouveau transformateur de compression et d'expansion : un bloc d'attention compressée régularise l'auto-attention des transformateurs, tandis qu'un bloc d'expansion apprend des représentations diversifiées. De plus, nous proposons un nouveau schéma de codage positionnel pour les transformateurs, imposant un biais inductif de continuité pour les images. Des expériences ont été menées sur des tâches de segmentation d'images médicales 2D et 3D : segmentation du disque optique/cuvette dans les images du fond d’œil (défi REFUGE'20), segmentation des polypes dans les images de coloscopie, et segmentation des tumeurs cérébrales dans les IRM (défi BraTS'19). Comparativement aux méthodes existantes représentatives, Segtran a constamment obtenu la meilleure précision de segmentation et a montré de bonnes capacités de généralisation transdomaine. Le code source de Segtran est disponible à l'adresse https://github.com/askerlee/segtran.

Segmentation d'images médicales à l'aide de transformateurs de compression et d'expansion | Articles de recherche récents | HyperAI