Ein neuer Graphenknotenklassifizierungsbenchmark: Struktur aus Histologiezellgraphen lernen

Wir stellen ein neues Benchmark-Datenset, Placenta, für die Knotenklassifizierung in einem bisher wenig erforschten Bereich vor: die Vorhersage mikroanatomischer Gewebestrukturen aus Zellgraphen in Plazentahistologie-Ganzbildbildern. Dieses Problem stellt für Graph-Lernverfahren aufgrund mehrerer Faktoren eine einzigartige Herausforderung dar. Zellgraphen sind groß (mehr als eine Million Knoten pro Bild), die Knotenmerkmale sind vielfältig (64-dimensionale Merkmale von 11 Zelltypen), die Klassenlabels sind unbalanciert (9 Klassen mit Anteilen zwischen 0,21 % und 40,0 % der Daten), und zelluläre Gemeinschaften bilden heterogen verteilte Gewebe mit stark variierender Größe (von 11 bis 44.671 Knoten pro Struktur). Hier veröffentlichen wir ein Datenset, das zwei Zellgraphen aus zwei Plazentahistologie-Bildern enthält und insgesamt 2.395.747 Knoten umfasst, von denen 799.745 über Ground-Truth-Labels verfügen. Wir präsentieren induktive Benchmark-Ergebnisse für sieben skalierbare Modelle und zeigen, wie die besonderen Eigenschaften von Zellgraphen die Entwicklung neuartiger Graph Neural Network-Architekturen vorantreiben können.