Ablenkungsbehaftete Schattenerkennung

Die Schattenerkennung ist eine wichtige und herausfordernde Aufgabe für die Szenenverstehens. Trotz vielversprechender Ergebnisse neuerer Methoden auf Basis tiefen Lernens leiden bestehende Ansätze weiterhin unter mehrdeutigen Fällen, bei denen die visuellen Erscheinungen von Schatten- und Nicht-Schattenbereichen ähnlich sind (im Folgenden als „Ablenkung“ bezeichnet). In diesem Artikel stellen wir ein Ablenkungs-orientiertes Schatten-Erkennungs-Netzwerk (DSDNet) vor, das die Semantik von visuellen Ablenkungsbereichen explizit lernt und in einem end-to-end-Framework integriert. Kernstück unseres Ansatzes ist ein neuartiges, eigenständiges und differenzierbares Ablenkungs-orientiertes Schatten-(DS)-Modul, das es ermöglicht, auffälligkeitsbewusste, differenzierende Merkmale für eine robuste Schattenerkennung zu lernen, indem falsch positive und falsch negative Vorhersagen explizit erfasst werden. Wir führen umfangreiche Experimente an drei öffentlichen Datensätzen zur Schattenerkennung durch: SBU, UCF und ISTD, um unsere Methode zu evaluieren. Die experimentellen Ergebnisse zeigen, dass unser Modell die Leistung der Schattenerkennung signifikant verbessert, indem es die Erkennung von falsch positiven und falsch negativen Regionen effektiv unterdrückt, und somit Ergebnisse auf dem Stand der Technik erzielt.