DGMIL: Distribution Guided Multiple Instance Learning für die Klassifikation von Whole Slide Images

Multiple Instance Learning (MIL) wird weithin zur Analyse histopathologischer Whole Slide Images (WSIs) eingesetzt. Bestehende MIL-Methoden modellieren jedoch die Datenausbreitung nicht explizit, sondern lernen lediglich eine bag- oder instanzbasierte Entscheidungsgrenze diskriminativ durch das Trainieren eines Klassifizierers. In diesem Paper stellen wir DGMIL vor: einen vertieften, featureverteilungsgeleiteten MIL-Ansatz für die WSI-Klassifikation und die Lokalisierung positiver Patche. Anstatt komplexe diskriminative Netzwerkarchitekturen zu entwerfen, zeigen wir, dass die inhärente Merkmalsverteilung histopathologischer Bilddaten als äußerst effektiver Leitfaden für die Instanzklassifikation dienen kann. Wir schlagen eine clusterbedingte Modellierung der Merkmalsverteilung sowie eine pseudo-Label-basierte iterative Verbesserung des Merkmalsraums vor, sodass sich positive und negative Instanzen im endgültigen Merkmalsraum leicht trennen lassen. Experimente auf dem CAMELYON16-Datensatz und dem TCGA-Lungenkrebs-Datensatz zeigen, dass unsere Methode sowohl für die globale Klassifikation als auch für die Lokalisierung positiver Patche neue SOTA-Ergebnisse erzielt.