RSAFormer: Eine Methode zur Polypensegmentierung mit Region-Self-Attention-Transformer
Die Koloskopie hat der Früherkennung und klinischen Diagnose von Darmkrebs große Bedeutung beigemessen. Die feine Segmentierung von Polypen bleibt jedoch eine herausfordernde Aufgabe. Bisherige State-of-the-art-Modelle weisen dennoch begrenzte Segmentierungsfähigkeiten auf, da die Grenzen zwischen gesundem Gewebe und Polypen oft unklar und stark相似 sind. Um dieses Problem zu bewältigen, schlagen wir ein Region Self-Attention Enhancement Network (RSAFormer) mit einem Transformer-Encoder vor, um robustere Merkmale zu erfassen. Im Gegensatz zu anderen hervorragenden Ansätzen verwendet RSAFormer ein einzigartiges Dual-Decoder-Struktur, um verschiedene Merkmalskarten zu generieren. Im Unterschied zu traditionellen Methoden, die typischerweise nur einen Decoder einsetzen, bietet diese Architektur eine größere Flexibilität und Detailgenauigkeit bei der Merkmalsextraktion. Zudem integriert RSAFormer ein Region Self-Attention Enhancement-Modul (RSA), das präzisere Merkmalsinformationen liefert und eine stärkere Wechselwirkung zwischen niedrig- und hochstufigen Merkmalen fördert. Dieses Modul verstärkt unsichere Bereiche, um genauere Randinformationen zu extrahieren, wobei diese Bereiche durch regionale Kontextinformationen gekennzeichnet sind. Um die Leistungsfähigkeit von RSAFormer zu demonstrieren, wurden umfangreiche Experimente an fünf gängigen Polyp-Datensätzen durchgeführt. RSAFormer erreicht eine mittlere Dice-Score von 92,2 % auf Kvasir und 83,5 % auf ETIS, wodurch es die meisten State-of-the-art-Modelle übertrifft.