Harvard-GF3300-Datensatz Zu Neurologischen Erkrankungen Der Netzhaut (Glaukom)
Datum
Größe
Veröffentlichungs-URL
Kategorien

Bei diesem Datensatz handelt es sich um einen Datensatz zu neurologischen Erkrankungen der Netzhaut (Glaukom) mit 3.300 Personen. Er enthält sowohl 2D- als auch 3D-Bilddaten und weist eine für die Glaukomerkennung ausgewogene Stichprobengröße für alle ethnischen Gruppen auf. Glaukom ist weltweit die häufigste Ursache für irreversible Blindheit und die Wahrscheinlichkeit, an Glaukom zu erkranken, ist bei Schwarzen doppelt so hoch wie bei Menschen anderer Rassen.
Der Harvard-GF-Datensatz soll die Fairness bei der KI-gestützten Glaukomdiagnose fördern und konzentriert sich dabei auf die retinale Nervenfaserschicht (RNFL), da Glaukom weltweit die häufigste Ursache für irreversible Blindheit ist. Dieser Datensatz befasst sich mit einigen der größten Herausforderungen, denen sich der Bereich des fairen Lernens derzeit gegenübersieht. Dazu gehören die begrenzte Anzahl und Qualität öffentlicher Datensätze, insbesondere der Mangel an geeigneten Datensätzen für die Erstellung fairer Computervision-Modelle, die Bilddaten erfordern, und ein besonderer Mangel an fairen Datensätzen in den Bereichen Medizin und Gesundheit.
Zu den Hauptmerkmalen des Harvard-GF-Datensatzes gehören:
- Es handelt sich um den ersten Fairness-Datensatz, der der Deep-Learning-Forschung in der medizinischen Bildgebung gewidmet ist.
- Der Datensatz enthält eine gleiche Anzahl von Personen aus den drei großen ethnischen Gruppen (Weiße, Schwarze und Asiaten), wodurch Probleme mit der Datenausgewogenheit vermieden werden, die die Frage des fairen Lernens erschweren könnten.
- Es stehen sowohl 2D- als auch 3D-Bilddaten zur Verfügung, was eine wenig erforschte Forschungsmöglichkeit für 3D-Fair-Learning bietet.