U-Net mit hierarchischer Flaschenhals-Aufmerksamkeit für die Landmarkeerkennung in Fundusbildern der degenerativen Netzhaut

Die Fundusfotografie wird routinemäßig in der klinischen Praxis eingesetzt, um die Präsenz und Schwere retinaler Degenerationskrankheiten wie altersbedingter Makuladegeneration (AMD), Glaukom und diabetischer Retinopathie (DR) zu dokumentieren, bei denen die Fovea und der Optic Disc (OD) wichtige retinale Landmarken darstellen. Die Auftreten von Läsionen, Drusen und anderen retinalen Abnormitäten während des Degenerationsprozesses erschwert jedoch erheblich die automatische Landmarkendetektion und -segmentierung. In diesem Beitrag schlagen wir das HBA-U-Net vor: ein U-Net-Rückgrat, das durch hierarchische Bottleneck-Aufmerksamkeit ergänzt wird. Das Netzwerk besteht aus einem neuartigen Bottleneck-Aufmerksamkeitsblock, der Selbstaufmerksamkeit, Kanalaufmerksamkeit und relativen Positionsaufmerksamkeit kombiniert und verfeinert, um retinale Abnormitäten hervorzuheben, die für die Segmentierung von Fovea und OD in der degenerierten Retina wichtig sein können. Das HBA-U-Net erzielte Stand-of-the-Art-Ergebnisse bei der Fovea-Detektion über verschiedene Datensätze und Augenzustände (ADAM: Euklidischer Abstand (ED) von 25,4 Pixeln, REFUGE: 32,5 Pixeln, IDRiD: 32,1 Pixeln), bei der OD-Segmentierung für AMD (ADAM: Dice-Koeffizient (DC) von 0,947) sowie bei der OD-Detektion für DR (IDRiD: ED von 20,5 Pixeln). Unsere Ergebnisse deuten darauf hin, dass das HBA-U-Net gut geeignet sein könnte für die Landmarkendetektion in Anwesenheit verschiedener retinaler Degenerationskrankheiten.