HyperAIHyperAI
vor 2 Monaten

Segmentierung ist alles, was Sie benötigen.

Cheng, Zehua ; Wu, Yuxiang ; Xu, Zhenghua ; Lukasiewicz, Thomas ; Wang, Weiyang
Segmentierung ist alles, was Sie benötigen.
Abstract

Regionalschlagwortmechanismen sind für bestehende tiefes Lernverfahren zur Objekterkennung in Bildern essentiell. Obwohl sie unter normalen Umständen im Allgemeinen eine gute Erkennungsleistung erzielen können, ist ihre Recall-Rate in Szenen mit Extremfällen unakzeptabel niedrig. Dies liegt hauptsächlich daran, dass die Bounding-Box-Annotierungen viel Umgebungsrauschen enthalten und eine nicht-maximale Unterdrückung (Non-Maximum Suppression, NMS) erforderlich ist, um die Zielfelder auszuwählen. Daher schlagen wir in dieser Arbeit das erste anchor-freie und NMS-freie Objekterkennungsmodell vor, das als schwach überwachte multimodale Annotierungssegmentierung (Weakly Supervised Multimodal Annotation Segmentation, WSMA-Seg) bezeichnet wird. Dieses Modell nutzt Segmentierungsmodelle, um eine genaue und robuste Objekterkennung ohne NMS zu erreichen. In WSMA-Seg werden multimodale Annotierungen verwendet, um eine instanzbasierte Segmentierung unter Verwendung schwach überwachter Bounding-Boxen durchzuführen; zudem haben wir einen lauf-datenbasierten Algorithmus entwickelt, um die Konturen von Objekten nachzuverfolgen. Darüber hinaus schlagen wir eine multiskalige Pooling-Segmentierung (Multi-Scale Pooling Segmentation, MSP-Seg) als grundlegendes Segmentierungsmodell von WSMA-Seg vor, um eine genauere Segmentierung zu erreichen und die Erkennungspräzision von WSMA-Seg zu verbessern. Experimentelle Ergebnisse auf mehreren Datensätzen zeigen, dass der vorgeschlagene WSMA-Seg-Ansatz den aktuellen Stand der Technik bei Detektoren übertrifft.