Roto-Translation Äquivariante Faltungsnetze: Anwendung auf die Analyse von Histopathologischen Bildern

Die Rotationsinvarianz ist eine gewünschte Eigenschaft von maschinelles Lernen-Modellen für die medizinische Bildanalyse und insbesondere für Anwendungen der computergestützten Pathologie. Wir schlagen einen Rahmen vor, um die geometrische Struktur der speziellen euklidischen Bewegungsgruppe SE(2) in Faltungsnetzen zu kodieren, um durch die Einführung von SE(2)-Gruppenfaltungsschichten Translations- und Rotationsäquivarianz zu erzielen. Diese Struktur ermöglicht es Modellen, Merkmalsrepräsentationen mit einer diskretisierten Orientierungsdimension zu lernen, die sicherstellt, dass ihre Ausgaben unter einer diskreten Menge von Rotationen invariant sind. Herkömmliche Ansätze zur Rotationsinvarianz basieren hauptsächlich auf Datenverstärkung (Data Augmentation), aber dies garantiert nicht die Robustheit der Ausgabe, wenn das Eingabebild rotiert wird. Zudem können herkömmliche trainierte CNNs Testzeit-Rotationsverstärkung benötigen, um ihre volle Leistungsfähigkeit zu erreichen. Diese Studie konzentriert sich auf Anwendungen der histopathologischen Bildanalyse, bei denen es wünschenswert ist, dass beliebige globale Orientierungsinformationen des abgebildeten Gewebes nicht von den maschinellen Lernmodellen erfasst werden. Der vorgeschlagene Rahmen wird anhand dreier verschiedener Aufgaben der histopathologischen Bildanalyse (Mitosenerkennung, Kernsegmentierung und Tumorklassifikation) evaluiert. Für jedes Problem präsentieren wir eine vergleichende Analyse und zeigen, dass durch die Verwendung des vorgeschlagenen Rahmens konsistente Leistungssteigerungen erzielt werden können.