Die Shanghai Jiao Tong University Veröffentlicht Den MedMNIST-Datensatz Zur Medizinischen Bildanalyse Und Einen Neuen Benchmark

Die medizinische Bildanalyse ist ein sehr komplexes interdisziplinäres Feld. Vor Kurzem hat die Shanghai Jiao Tong University den MedMNIST-Datensatz veröffentlicht, der die Entwicklung der medizinischen Bildanalyse vorantreiben soll.
Das Problem der medizinischen Bildanalyse
Die medizinische Bildanalyse ist ein anerkannt „schwieriges“ Thema.
Erstens handelt es sich um ein interdisziplinäres Feld.Von den Praktikern wird ein breit gefächerter Wissenshintergrund verlangt. Selbst wenn Sie sich beruflich mit Computer Vision beschäftigen oder in der klinischen Medizin tätig sind, haben Sie bestenfalls nur einen halben Schritt in Richtung medizinischer Bildanalyse gemacht.
Wenn Sie optimistisch sind, beherrschen Sie nach Jahren des Studiums und der Forschung endlich die wechselseitigen Fähigkeiten der Computervision und der klinischen Medizin, und die nächsten Schritte werden Ihnen schreckliche Sorgen bereiten.Denn diese Daten stammen aus unterschiedlichen Quellen, unter anderem Röntgen, CT, Ultraschall …Es ist so schwierig, so viele nicht standardmäßige Datensätze mit unterschiedlichen Mustern zu analysieren und zu verarbeiten!
Dies ist nicht das Ende. Obwohl Deep Learning die Forschung und Anwendung der medizinischen Bildanalyse dominiert, ist der Personalaufwand für die Modellanpassung zu hoch. AutoML ist nützlich,Allerdings gibt es derzeit grundsätzlich keine AutoML-Benchmarks für die medizinische Bildklassifizierung.

Die medizinische Bildanalyse ist mit vielen Schwierigkeiten behaftet, aber der kürzlich von der Shanghai Jiao Tong University veröffentlichte MedMNIST-Datensatz bietet ein leistungsfähiges Tool zur Lösung dieser seit langem bestehenden Probleme.
10 öffentliche Datensätze, 450.000 Bilder neu organisiert
MedMNIST ist eine Sammlung von 10 öffentlichen medizinischen Datensätzen.Alle Daten wurden vorverarbeitet und in Standarddatensätze unterteilt, darunter Trainingssatz, Validierungssatz und Testteilmenge. Die Datenquellen umfassen verschiedene Bildgebungsmodi wie Röntgen, OCT, Ultraschall, CT usw. und es werden multimodale Daten derselben Läsion gewonnen. Wie der MNIST-Datensatz,MedMNIST kann Klassifizierungsaufgaben an leichten 28*28-Bildern durchführen.

MedMNIST hat die folgenden Eigenschaften:
Lehrreich:Die multimodalen Daten stammen aus mehreren öffentlichen medizinischen Bilddatensätzen und verwenden die Creative Commons (CC)-Lizenz oder eine kostenlose Lizenz, um die Verwendung in der Lehre zu erleichtern.
Standardisierung:Alle Daten wurden im gleichen Format vorverarbeitet, wodurch die Einstiegshürde gesenkt und die Daten für jeden verfügbar gemacht wurden.
Diversität:Der multimodale Datensatz deckt verschiedene Datenmodi ab, unterstützt Datengrößen von 100 bis 100.000 und verfügt über umfangreiche Aufgabentypen wie binäre Klassifizierung, multivariate Klassifizierung, ordinale Regression und Multi-Label.
Leicht:Die Bildgröße 28 x 28 erleichtert schnelles Prototyping, schnelle Iteration und Experimente mit multimodalen maschinellen Lern- und AutoML-Algorithmen.
MedMNIST-Datensatz
Verlag:Shanghai Jiao Tong Universität
Enthaltene Menge:454.591 Bilder
Datenformat:NPZ
Datengröße:654 MB
Veröffentlichungszeit:28. Oktober 2020
Downloadadresse:http://dwz.date/dew2
Die Zehnkampfmethode ist gut und setzt einen neuen Maßstab für AutoML
Inspiriert vom Medical Segmentation Decathlon,Forscher der Shanghai Jiao Tong University haben außerdem den MedMNIST Classification Decathlon als leichten AutoML-Benchmark für die Klassifizierung medizinischer Bilder veröffentlicht.
Die Forscher verwendeten den MedMNIST-Klassifizierungs-Decathlon, um die Leistung des Algorithmus für alle 10 Datensätze zu bewerten, und verglichen ihn mit mehreren anderen Basismethoden, darunter ResNets (18, 50), Auto-Sklearn, AutoKeras und Google AutoML Vision.

Die experimentellen Ergebnisse zeigen, dass es im Experiment keinen Algorithmus gibt, der für alle 10 Datensätze eine gute Generalisierungsleistung erzielen kann.Dieses Experiment ist von großer Bedeutung für die Erforschung von AutoML-Algorithmen, die sich gut auf verschiedene Datenmodi, Aufgabentypen und Datenskalen übertragen lassen.
Der MedMNIST-Klassifizierungs-Zehnkampf-Benchmark wird die zukünftige Forschung zu AutoML für die medizinische Bildanalyse fördern.
Verwandte Artikel:
Open-Source-Adresse:
https://github.com/MedMNIST/MedMNIST
Laden Sie jetzt den Datensatz herunter und beginnen Sie mit Ihrem Training
Laden Sie den Datensatz herunter, trainieren Sie das maschinelle Lernmodell online und beginnen Sie mit Ihrer Praxis mit OpenBayes.
OpenBayes ist eine Cloud-Service-Plattform, die Cloud-Rechenleistung für maschinelles Lernen bereitstellt. Es verfügt über einen groß angelegten Supercomputer-Cluster, unterstützt GPU- und CPU-Rechenressourcen verschiedener Konfigurationen und bietet ein universelles, sofort einsatzbereites Modellierungssystem für maschinelles Lernen. Auch ohne Machine-Learning-Erfahrung lassen sich intelligente Systeme schnell etablieren.
Derzeit unterstützen die Containerprodukte von OpenBayes bereits TensorFlow, PyTorch, MXNet, Darknet, cpp-develop usw. in CPU- und GPU-Umgebungen, verschiedene Versionen und Typen von Standard-Frameworks für maschinelles Lernen und verschiedene gemeinsame Abhängigkeiten.

OpenBayes bietet außerdem CPU, NVIDIA T4, NVIDIA Tesla V100 und andere RechenressourcenUnabhängig davon, ob es sich um das zentrale Training großer Datenmengen oder den stromsparenden Betrieb von Modellen handelt, können die Benutzeranforderungen problemlos erfüllt werden.

Der MedMNIST-Datensatz ist jetzt auf OpenBayes verfügbar.

openbayes.com besuchen Registrieren Sie sich als neuer Benutzer mit dem Einladungscode [HyperAI]Sie können genießen240 Minuten CPU + 180 Minuten NVIDIA vGPU pro Woche Kostenlose Rechenleistung~
ZugangDie folgenden LinksoderKlicken Sie hier, um den Originalartikel zu lesen, beginnen Sie Ihre MedMNIST-Erkundungsreise!
Verknüpfung: http://dwz.date/dew2
-- über--