Ensemble De Données Harvard-GF3300 Sur Les Maladies Neurologiques Rétiniennes (glaucome)
Date
Taille
URL de publication
Catégories

Cet ensemble de données est un ensemble de données sur les maladies neurologiques rétiniennes (glaucome) de 3 300 sujets, contenant des données d'images 2D et 3D, et équilibré en termes de taille d'échantillon entre les groupes ethniques pour la détection du glaucome. Le glaucome est la principale cause de cécité irréversible dans le monde, et les personnes noires sont deux fois plus susceptibles de souffrir de glaucome que les autres races.
L'ensemble de données Harvard-GF est conçu pour promouvoir l'équité dans le diagnostic automatisé du glaucome par l'IA, en se concentrant sur la couche de fibres nerveuses rétiniennes (RNFL), car le glaucome est la principale cause de cécité irréversible dans le monde. Cet ensemble de données aborde certains des principaux défis auxquels est actuellement confronté le domaine de l'apprentissage équitable, notamment le nombre et la qualité limités des ensembles de données publics, en particulier le manque d'ensembles de données adaptés à la création de modèles de vision par ordinateur équitables qui nécessitent des données d'imagerie, et un manque particulier d'ensembles de données équitables dans les domaines médical et de la santé.
Les principales caractéristiques de l'ensemble de données Harvard-GF comprennent :
- Il s’agit du premier ensemble de données d’équité dédié à la recherche en apprentissage profond en imagerie médicale.
- L'ensemble de données contient un nombre égal de sujets issus des trois principaux groupes raciaux (blancs, noirs et asiatiques), ce qui évite les problèmes de déséquilibre des données qui pourraient brouiller la question de l'apprentissage équitable.
- Des données d’imagerie 2D et 3D sont disponibles, ce qui offre une opportunité de recherche sous-explorée pour l’apprentissage équitable en 3D.