Effiziente anchorfreie universelle Läsionsdetektion in CT-Scans

Bestehende universelle Läsionserkennungsverfahren (ULD) nutzen rechenintensive, auf Anker basierende Architekturen, die auf vordefinierten Ankerboxen beruhen. Dies führt zu unzufriedenstellenden Erkennungsleistungen, insbesondere bei kleinen und mittelgroßen Läsionen. Zudem verallgemeinern diese vorgegebenen festen Ankergrößen und -verhältnisse sich nicht gut auf verschiedene Datensätze. Daher schlagen wir ein robustes einstufiges, ankerfreies Läsionserkennungsnetzwerk vor, das durch die Ausnutzung der Tatsache, dass Boxvorhersagen nach Relevanz anhand ihres Mittelpunkts sortiert werden können, statt nach ihrem Überlapp mit dem Objekt, über verschiedene Läsionsgrößen hinweg gute Leistungen erzielt.Des Weiteren zeigen wir, dass die ULD durch explizites Bereitstellen domänenspezifischer Informationen in Form von mehrfach intensitätsbasierten Bildern verbessert werden kann, die unter Verwendung verschiedener HU-Fenster generiert werden. Dies wird durch eine selbst-merkmalsfusion auf Basis von Selbst-Aufmerksamkeit (Self-Attention) und eine Initialisierung des Backbones mit Gewichten ergänzt, die durch Selbstüberwachung über CT-Bilder gelernt wurden. Wir erzielen vergleichbare Ergebnisse wie die derzeit besten Methoden und erreichen eine Gesamtsensitivität von 86,05 % im DeepLesion-Datensatz, der etwa 32.000 CT-Bilder umfasst, bei denen Läsionen in verschiedenen Körpereingeweiden annotiert sind.