Command Palette
Search for a command to run...
Segmentierung ist alles, was Sie benötigen.
Segmentierung ist alles, was Sie benötigen.
Cheng Zehua ; Wu Yuxiang ; Xu Zhenghua ; Lukasiewicz Thomas ; Wang Weiyang
Zusammenfassung
Regionalschlagwortmechanismen sind für bestehende tiefes Lernverfahren zur Objekterkennung in Bildern essentiell. Obwohl sie unter normalen Umständen im Allgemeinen eine gute Erkennungsleistung erzielen können, ist ihre Recall-Rate in Szenen mit Extremfällen unakzeptabel niedrig. Dies liegt hauptsächlich daran, dass die Bounding-Box-Annotierungen viel Umgebungsrauschen enthalten und eine nicht-maximale Unterdrückung (Non-Maximum Suppression, NMS) erforderlich ist, um die Zielfelder auszuwählen. Daher schlagen wir in dieser Arbeit das erste anchor-freie und NMS-freie Objekterkennungsmodell vor, das als schwach überwachte multimodale Annotierungssegmentierung (Weakly Supervised Multimodal Annotation Segmentation, WSMA-Seg) bezeichnet wird. Dieses Modell nutzt Segmentierungsmodelle, um eine genaue und robuste Objekterkennung ohne NMS zu erreichen. In WSMA-Seg werden multimodale Annotierungen verwendet, um eine instanzbasierte Segmentierung unter Verwendung schwach überwachter Bounding-Boxen durchzuführen; zudem haben wir einen lauf-datenbasierten Algorithmus entwickelt, um die Konturen von Objekten nachzuverfolgen. Darüber hinaus schlagen wir eine multiskalige Pooling-Segmentierung (Multi-Scale Pooling Segmentation, MSP-Seg) als grundlegendes Segmentierungsmodell von WSMA-Seg vor, um eine genauere Segmentierung zu erreichen und die Erkennungspräzision von WSMA-Seg zu verbessern. Experimentelle Ergebnisse auf mehreren Datensätzen zeigen, dass der vorgeschlagene WSMA-Seg-Ansatz den aktuellen Stand der Technik bei Detektoren übertrifft.