HyperAIHyperAI
vor 11 Tagen

Künstliche Intelligenz in der Lungengesundheit: Benchmarking von Detektions- und Diagnosemodellen über mehrere CT-Scan-Datensätze

Tushar, Fakrul Islam, Wang, Avivah, Dahal, Lavsen, Harowicz, Michael R., Lafata, Kyle J., Tailor, Tina D., Lo, Joseph Y.
Künstliche Intelligenz in der Lungengesundheit: Benchmarking von Detektions- und Diagnosemodellen über mehrere CT-Scan-Datensätze
Abstract

Lungenkrebs bleibt weltweit die Hauptursache für Krebstod, und die Früherkennung mittels niederenergetischer Computertomographie (LDCT) hat erhebliches Potenzial gezeigt, die Sterblichkeitsraten zu senken. Mit der zunehmenden Integration künstlicher Intelligenz (KI) in die medizinische Bildgebung erfordern die Entwicklung und Bewertung robuster KI-Modelle Zugang zu großen, gut annotierten Datensätzen. In dieser Studie stellen wir die Nutzbarkeit des Duke Lung Cancer Screening (DLCS)-Datensatzes vor, des größten öffentlich verfügbaren LDCT-Datensatzes mit über 2.000 Scans und 3.000 von Experten verifizierten Knoten. Wir benchmarken Deep-Learning-Modelle sowohl für die 3D-Knotendetektion als auch für die Lungenkrebsklassifikation an internen und externen Datensätzen, darunter LUNA16, LUNA25 und NLST-3D+. Für die Detektion entwickeln wir zwei auf MONAI basierende RetinaNet-Modelle (DLCSDmD und LUNA16-mD), die anhand des Competition Performance Metrics (CPM) evaluiert werden. Für die Klassifikation vergleichen wir fünf Modelle, darunter state-of-the-art vortrainierte Modelle (Genesis, Med3D), ein selbstüberwachtes Grundmodell (FMCB), ein zufällig initialisiertes ResNet50 sowie ein neu vorgestelltes Strategisches Warm-Start++ (SWS++)-Modell. SWS++ nutzt ausgewählte Kandidatenschnitte, um innerhalb desselben Detektionspfeilers einen Klassifikations-Backbone vorzutrainieren, wodurch eine auf die Aufgabe zugeschnittene Merkmalslernung ermöglicht wird. Unsere Modelle zeigten eine starke Verallgemeinerungsfähigkeit, wobei SWS++ auf mehreren Datensätzen Leistungen erreichte, die mit oder über bestehenden Grundmodellen vergleichbar waren (AUC: 0,71 bis 0,90). Alle Codes, Modelle und Daten werden öffentlich bereitgestellt, um Reproduzierbarkeit und Zusammenarbeit zu fördern. Diese Arbeit etabliert eine standardisierte Benchmarking-Ressource für die KI-Forschung im Bereich Lungenkrebs und unterstützt zukünftige Bemühungen in der Modellentwicklung, Validierung und klinischen Umsetzung.

Künstliche Intelligenz in der Lungengesundheit: Benchmarking von Detektions- und Diagnosemodellen über mehrere CT-Scan-Datensätze | Neueste Forschungsarbeiten | HyperAI