Aufmerksamkeitsbasiertes Feedback-Netzwerk für grenzengewahrte auffällige Objektdetektion

Neuere auf Deep Learning basierende Methoden zur Erkennung auffälliger Objekte erreichen durch den Einsatz von Fully Convolutional Neural Networks (FCNs) ansprechende Leistung. Allerdings leiden die meisten dieser Ansätze unter dem sogenannten Randproblem. Die derzeit fortschrittlichsten Methoden nutzen Techniken zur Merkmalsaggregation und können die Position des auffälligen Objekts präzise identifizieren, scheitern jedoch oft daran, das gesamte Objekt mit feinen, exakten Rändern zu segmentieren, insbesondere bei schmalen, feinen Streifen. Daher besteht weiterhin erheblicher Verbesserungsbedarf bei FCN-basierten Modellen. In dieser Arbeit stellen wir die Attentive Feedback Modules (AFMs) vor, um die Struktur der Objekte besser zu erfassen. Zudem wird eine randverbesserte Verlustfunktion (Boundary-Enhanced Loss, BEL) eingesetzt, um feine Ränder präzise zu lernen. Unser vorgeschlagenes tiefes Modell erzielt überzeugende Ergebnisse hinsichtlich der Objektränder und erreicht state-of-the-art-Leistung auf fünf weit verbreiteten Benchmarks für die Erkennung auffälliger Objekte. Das Netzwerk arbeitet vollständig konvolutionell und erreicht eine Geschwindigkeit von 26 FPS, ohne dass zusätzliche Nachbearbeitungsschritte erforderlich sind.