TransMIL: Transformer-basiertes korreliertes mehrfaches Instanzlernen zur Klassifikation von Ganzpräparatbildern

Mehrfachinstanz-Lernen (Multiple Instance Learning, MIL) ist ein leistungsfähiges Werkzeug zur Lösung der schwach überwachten Klassifikation bei der pathologischen Diagnose auf Basis von Whole Slide Images (WSI). Derzeitige MIL-Methoden beruhen jedoch häufig auf der Annahme unabhängiger und identisch verteilter Instanzen, wodurch die Korrelationen zwischen verschiedenen Instanzen vernachlässigt werden. Um dieses Problem anzugehen, stellen wir einen neuen Ansatz namens korreliertes MIL vor und liefern einen Beweis für die Konvergenz. Auf Basis dieses Rahmens entwickeln wir eine Transformer-basierte MIL-Methode (TransMIL), die sowohl morphologische als auch räumliche Informationen effektiv ausnutzt. Die vorgeschlagene TransMIL kann unbalancierte und balancierte sowie binäre und mehrklassige Klassifikationsaufgaben effizient bearbeiten und zeichnet sich durch hervorragende Visualisierbarkeit und Interpretierbarkeit aus. Wir führen verschiedene Experimente zu drei unterschiedlichen Aufgaben der computergestützten Pathologie durch und erreichen gegenüber aktuellen State-of-the-Art-Methoden eine bessere Leistung sowie eine schnellere Konvergenz. Die Test-AUC für die binäre Tumorklassifikation erreicht auf dem CAMELYON16-Datensatz bis zu 93,09 %. Bei der Klassifikation von Krebsuntertypen erzielt die Methode AUC-Werte von bis zu 96,03 % auf dem TCGA-NSCLC-Datensatz und 98,82 % auf dem TCGA-RCC-Datensatz. Die Implementierung ist unter folgender Adresse verfügbar: https://github.com/szc19990412/TransMIL.