Übersteigern der menschlichen Genauigkeit: Erkennen von Gallenblasenkrebs auf USG-Bildern mit Curriculumslernen

Wir untersuchen das Potenzial von CNN-basierten Modellen zur Erkennung von Gallenblasenkrebs (GBC) an Ultraschallbildern (USG), da bisher keine vergleichbare Studie bekannt ist. Ultraschall ist die am häufigsten verwendete diagnostische Methode für Gallenblasenerkrankungen aufgrund seiner geringen Kosten und guter Verfügbarkeit. Allerdings sind Ultraschallbilder aufgrund der niedrigen Bildqualität, des Rauschens und der variierenden Perspektiven, die durch die handgehaltene Natur des Sensors entstehen, schwierig zu analysieren. Unsere umfassende Untersuchung der neuesten (SOTA) Bildklassifizierungstechniken zeigt, dass diese oft versagen, die relevanten Gallenblasengebiete aufgrund der Schatten in den Ultraschallbildern zu erkennen. Auch SOTA-Objekterkennungstechniken erzielen aufgrund von störenden Texturen, verursacht durch Rauschen oder benachbarte Organe, eine geringe Genauigkeit. Wir schlagen GBCNet vor, um die Herausforderungen unseres Problems zu bewältigen. GBCNet extrahiert zunächst die Regionen von Interesse (ROIs), indem es die Gallenblase (und nicht den Krebs) detektiert, und verwendet dann eine neuartige mehrskalige, zweiter Ordnungspooling-Architektur, die sich auf die Klassifizierung von GBC spezialisiert hat. Um störende Texturen effektiv zu behandeln, schlagen wir ein Curriculum vor, das sich an der menschlichen Sehschärfe orientiert und die Texturbiases in GBCNet reduziert. Experimentelle Ergebnisse zeigen, dass GBCNet signifikant besser abschneidet als SOTA-CNN-Modelle sowie Experten-Radiologen. Unsere technischen Innovationen sind auch für andere Aufgaben der Ultraschallbildanalyse generisch nutzbar. Daher präsentieren wir als Validierung auch die Effektivität von GBCNet bei der Erkennung von Brustkrebs aus USG-Bildern. Die Projektseite mit Quellcode, trainierten Modellen und Daten ist unter https://gbc-iitd.github.io/gbcnet verfügbar.