MHIST Histopathologie-Bilddatensatz
Datum
Veröffentlichungs-URL
Lizenz
其他
Kategorien

MHIST steht für Minimalist Histopathology Image Analysis Dataset, ein Bilddatensatz zur binären Klassifizierung. Der Datensatz enthält 3.152 Bilder von kolorektalen Polypen mit fester Größe und die Goldstandard-Annotation jedes Bildes wird von sieben Gastrointestinalpathologen per Mehrheitsbeschluss festgelegt. MHIST gibt außerdem für jedes Bild den Grad der Übereinstimmung der Kommentatoren an. Als minimaler Datensatz belegt dieser Datensatz weniger als 400 MB Speicherplatz. Die ResNet-18-Basislinie wird auf MHIST in nur 6 Minuten auf einer NVIDIA RTX 3090 mit 3,5 GB Speicher bis zur Konvergenz trainiert.
Als Anwendungsfall verwendeten die Forscher MHIST, um natürliche Probleme zu untersuchen, die bei der Klassifizierung histopathologischer Bilder auftreten, beispielsweise wie sich Datensatzgröße, Netzwerktiefe, Transferlernen und Beispiele mit hoher Divergenz auf die Modellleistung auswirken.