HyperAIHyperAI
vor 2 Monaten

MVP-Net: Mehrfachansicht-FPN mit positionsbewusster Aufmerksamkeit für tiefes universelles Läsionsdetektion

Li, Zihao ; Zhang, Shu ; Zhang, Junge ; Huang, Kaiqi ; Wang, Yizhou ; Yu, Yizhou
Abstract

Die universelle Läsionserkennung (ULD) auf Computertomografien (CT) ist ein wichtiges, aber unterentwickeltes Problem. Kürzlich wurden tiefenlernenbasierte Ansätze für ULD vorgeschlagen, die darauf abzielen, repräsentative Merkmale aus annotierten CT-Daten zu lernen. Allerdings hemmt das hohe Datenbedürfnis von Tiefenlernmodellen und der Mangel an medizinischer Annotation den weiteren Fortschritt dieser Ansätze. In diesem Artikel schlagen wir vor, Wissensdomänen aus der klinischen Praxis in die Modellgestaltung von universellen Läsionserkennern zu integrieren. Insbesondere, da Radiologen tendenziell mehrere Fenster zur genauen Diagnose prüfen, modellieren wir diesen Prozess explizit und schlagen ein mehrfachansichtiges Feature-Pyramid-Netzwerk (FPN) vor, bei dem mehrfachansichtige Merkmale aus Bildern mit unterschiedlichen Fensterbreiten und -ebenen extrahiert werden; um diese mehrfachansichtige Information effektiv zu kombinieren, schlagen wir außerdem ein positionssensitives Aufmerksamkeitsmodul vor. Mit dem vorgeschlagenen Modelldesign wird das Problem des hohen Datenbedarfs gelindert, da die Lerlaufgabe durch die korrekt induzierte klinische Praxisvorinformation vereinfacht wird. Wir zeigen vielversprechende Ergebnisse mit dem vorgeschlagenen Modell und erreichen einen absoluten Gewinn von $\mathbf{5{,}65\%}$ (in der Sensitivität bei [email protected]) im Vergleich zum bisherigen Stand der Technik auf dem NIH DeepLesion-Datensatz.