L'Université Jiao Tong De Shanghai Publie Un Ensemble De Données D'analyse D'images Médicales MedMNIST Et Une Nouvelle Référence

L’analyse d’images médicales est un domaine interdisciplinaire très complexe. Récemment, l'Université Jiao Tong de Shanghai a publié l'ensemble de données MedMNIST, qui devrait favoriser le développement de l'analyse d'images médicales.
Le casse-tête de l'analyse d'images médicales
L'analyse d'images médicales est un sujet reconnu comme « difficile ».
Tout d’abord, c’est un domaine interdisciplinaire.Les praticiens doivent posséder un large éventail de connaissances. Même si vous êtes un professionnel étudiant la vision par ordinateur ou un praticien en médecine clinique, au mieux, vous n’avez fait qu’un demi-pas vers l’analyse d’images médicales.
Avec optimisme, après des années d’études et de recherche, vous maîtrisez enfin les compétences bidirectionnelles de la vision par ordinateur et de la médecine clinique, et les prochaines étapes vous feront mourir d’inquiétude.Parce que ces données proviennent de sources diverses, notamment les rayons X, la tomodensitométrie, l'échographie...Il est si difficile d’analyser et de traiter autant d’ensembles de données non standard avec des modèles différents !
Ce n'est pas la fin. Bien que l’apprentissage profond ait dominé la recherche et l’application de l’analyse d’images médicales, le coût en main-d’œuvre de l’ajustement du modèle est trop élevé. AutoML est utile,Cependant, il n’existe actuellement pratiquement aucun benchmark AutoML pour la classification des images médicales.

L'analyse d'images médicales est semée d'embûches, mais l'ensemble de données MedMNIST récemment publié par l'Université Jiao Tong de Shanghai fournit un outil puissant pour résoudre ces problèmes de longue date.
10 jeux de données publics, 450 000 images réorganisées
MedMNIST est une collection de 10 ensembles de données médicales publiques.Toutes les données ont été prétraitées et divisées en ensembles de données standard comprenant un ensemble d’entraînement, un ensemble de validation et un sous-ensemble de test. Les sources de données incluent différents modes d'imagerie tels que les rayons X, l'OCT, l'échographie, la tomodensitométrie, etc., et des données multimodales de la même lésion sont obtenues. Comme l'ensemble de données MNIST,MedMNIST peut effectuer des tâches de classification sur des images légères 28*28.

MedMNIST présente les caractéristiques suivantes :
Pédagogique:Les données multimodales proviennent de plusieurs ensembles de données d'images médicales publiques et utilisent la licence Creative Commons (CC) ou la licence libre pour faciliter l'utilisation pédagogique.
standardisation:Toutes les données ont été prétraitées dans le même format, abaissant la barrière d’entrée et les rendant accessibles à tous.
Diversité:L'ensemble de données multimodal couvre différents modes de données, prend en charge des tailles de données allant de 100 à 100 000 et dispose de types de tâches riches tels que la classification binaire, la classification multivariée, la régression ordinale et les étiquettes multiples.
Léger:La taille d'image 28*28 facilite le prototypage rapide, l'itération rapide et l'expérimentation d'algorithmes d'apprentissage automatique multimodal et d'AutoML.
Ensemble de données MedMNIST
Agence d'édition :Université Jiao Tong de Shanghai
Quantité incluse :454 591 images
Format des données :NPZ
Taille des données :654 Mo
Heure de sortie :28 octobre 2020
Adresse de téléchargement :http://dwz.date/dew2
La méthode du décathlon est bonne, elle crée une nouvelle référence pour AutoML
Inspiré du Décathlon de Segmentation Médicale,Des chercheurs de l'Université Jiao Tong de Shanghai ont également publié le MedMNIST Classification Decathlon comme référence AutoML légère dans la classification des images médicales.
Les chercheurs ont utilisé le décathlon de classification MedMNIST pour évaluer les performances de l'algorithme sur les 10 ensembles de données et l'ont comparé à plusieurs autres méthodes de base, notamment ResNets (18, 50), auto-sklearn, AutoKeras et Google AutoML Vision.

Les résultats expérimentaux montrent qu’aucun algorithme de l’expérience ne peut atteindre de bonnes performances de généralisation pour les 10 ensembles de données.Cette expérience est d’une grande importance pour explorer les algorithmes AutoML qui se généralisent bien à différents modes de données, types de tâches et échelles de données.
Le benchmark de classification du décathlon MedMNIST favorisera les recherches futures sur AutoML pour l'analyse d'images médicales.
Articles connexes :
Adresse open source :
https://github.com/MedMNIST/MedMNIST
Téléchargez maintenant l'ensemble de données et commencez votre formation
Téléchargez l'ensemble de données, entraînez le modèle d'apprentissage automatique en ligne et démarrez votre pratique avec OpenBayes.
OpenBayes est une plateforme de services cloud qui fournit une puissance de calcul cloud pour l'apprentissage automatique. Il dispose d'un cluster de supercalcul à grande échelle, prend en charge les ressources de calcul GPU et CPU de diverses configurations et dispose d'un système de modélisation d'apprentissage automatique à usage général qui peut être utilisé prêt à l'emploi. Des systèmes intelligents peuvent être rapidement mis en place sans expérience d’apprentissage automatique.
Actuellement, les produits de conteneur de puissance de calcul d'OpenBayes prennent déjà en charge TensorFlow, PyTorch, MXNet, Darknet, cpp-develop, etc. dans les environnements CPU et GPU, différentes versions et types de frameworks d'apprentissage automatique standard et diverses dépendances courantes.

OpenBayes fournit également CPU, NVIDIA T4, NVIDIA Tesla V100 et autres ressources informatiquesQu'il s'agisse d'une formation centralisée de données massives ou d'un fonctionnement résident sur un modèle à faible consommation d'énergie, il peut facilement répondre aux besoins des utilisateurs.

L'ensemble de données MedMNIST est désormais disponible sur OpenBayes.

Visitez openbayes.com Inscrivez-vous en tant que nouvel utilisateur avec le code d'invitation [HyperAI]Vous pouvez profiter240 minutes de CPU + 180 minutes de NVIDIA vGPU par semaine Puissance de calcul gratuite~
accéderLes liens suivantsouCliquez pour lire l'article original, commencez votre voyage d'exploration MedMNIST !
Lien : http://dwz.date/dew2
-- sur--