Verbesserung von RetinaNet für die Detektion von CT-Lesionen durch dichte Masken aus schwachen RECIST-Labels

Genaue und automatisierte Läsionserkennung in der Computertomographie (CT) ist eine wichtige, aber herausfordernde Aufgabe aufgrund der großen Variation von Läsionstypen, -größen, -Lagen und -Erscheinungen. Kürzliche Arbeiten zur Läsionserkennung in CT verwenden zweistufige Regionenvorschlagsmethoden, die mit Zentroid- oder Bounding-Box-Annotierungen trainiert werden. Wir schlagen einen hochgenauen und effizienten einstufigen Läsionendetektor vor, indem wir ein RetinaNet umgestalten, um den besonderen Herausforderungen in der medizinischen Bildgebung gerecht zu werden. Insbesondere optimieren wir die Ankerkonfigurationen unter Verwendung eines Differential-Evolution-Suchalgorithmus. Für das Training nutzen wir die Response Evaluation Criteria in Solid Tumors (RECIST)-Annotierungen, die im klinischen Alltag gemessen werden. Wir integrieren dichte Masken aus schwachen RECIST-Labels, die automatisch mithilfe von GrabCut generiert werden, in das Trainingsziel. In Kombination mit anderen Fortschritten erzielt dies neue Spitzenleistungen. Wir evaluieren unsere Methode am öffentlichen DeepLesion-Benchmark, der 32.735 Läsionen im gesamten Körper umfasst. Unser einstufiger Detektor erreicht eine Sensitivität von 90,77 % bei 4 Falschpositiven pro Bild und übertrifft damit die besten bisher veröffentlichten Methoden um mehr als 5 %.