HyperAIHyperAI
il y a 8 jours

Un grand ensemble de données multi-domaines pour la détection des cellules sanguines blanches avec des attributs morphologiques pour une explication

Abdul Rehman, Talha Meraj, Aiman Mahmood Minhas, Ayisha Imran, Mohsen Ali, Waqas Sultani
Un grand ensemble de données multi-domaines pour la détection des cellules sanguines blanches avec des attributs morphologiques pour une explication
Résumé

Un diagnostic précoce de la leucémie peut sauver des milliers de vies chaque année. Sans informations morphologiques sur les leucocytes (WBC), le pronostic de la leucémie reste difficile, et dépend de l’accès à des microscopes coûteux ainsi que de la disponibilité d’hématologues pour analyser les échantillons sanguins périphériques (PBS). Les méthodes fondées sur l’apprentissage profond peuvent aider les hématologues dans cette tâche. Toutefois, ces algorithmes nécessitent de grandes quantités de données étiquetées, qui ne sont pas facilement disponibles. Pour surmonter cette limitation, nous avons acquis un ensemble de données réaliste, généralisable et de grande taille. Pour collecter cet ensemble de données complet destiné à des applications réelles, deux microscopes provenant de gammes de prix différentes (microscope haut de gamme HCM et microscope bas de gamme LCM) ont été utilisés pour la capture d’images à trois grossissements (100x, 40x, 10x) via différents capteurs (appareil photo haut de gamme pour HCM, appareil photo de niveau intermédiaire pour LCM, et appareil photo de téléphone portable pour les deux). Le capteur haut de gamme est 47 fois plus coûteux que le capteur de niveau intermédiaire, et HCM est 17 fois plus cher que LCM. Dans cette collection, à l’aide de HCM à haute résolution (100x), des hématologues expérimentés ont annoté 10 300 types de WBC (14 catégories) ainsi que des artefacts, produisant 55 000 étiquettes morphologiques (taille cellulaire, chromatine nucléaire, forme nucléaire, etc.) à partir de 2 400 images provenant de plusieurs patients atteints de leucémie. Ces annotations ont ensuite été transférées aux deux autres grossissements de HCM, aux trois grossissements de LCM, ainsi qu’aux images capturées par chaque capteur. En complément du jeu de données LeukemiaAttri, nous fournissons des références (baselines) basées sur plusieurs détecteurs d’objets ainsi que des stratégies d’adaptation de domaine non supervisée (UDA), accompagnées de prédictions basées sur les caractéristiques morphologiques. Le jeu de données sera mis à disposition publiquement après publication afin de favoriser les recherches dans ce domaine.

Un grand ensemble de données multi-domaines pour la détection des cellules sanguines blanches avec des attributs morphologiques pour une explication | Articles de recherche récents | HyperAI