Richtungsbewusste räumliche Kontextmerkmale für Schattenerkennung

Die Schattenerkennung ist eine grundlegende und herausfordernde Aufgabe, da sie ein Verständnis der globalen Bildsemantik erfordert und Schatten unterschiedliche Hintergründe haben können. In dieser Arbeit wird ein neues Netzwerk zur Schattenerkennung vorgestellt, das den Bildkontext in einer richtungsbezogenen Weise analysiert. Um dies zu erreichen, formulieren wir zunächst den richtungsbezogenen Aufmerksamkeitsmechanismus in einem räumlichen rekurrenten neuronalen Netzwerk (RNN), indem wir Aufmerksamkeitsgewichte bei der Aggregation von räumlichen Kontextmerkmalen im RNN einführen. Durch das Lernen dieser Gewichte während des Trainings können wir einen richtungsbezogenen räumlichen Kontext (DSC) für die Schattenerkennung rekonstruieren. Diese Konzeption wurde in das DSC-Modul weiterentwickelt und in ein CNN integriert, um DSC-Merkmale auf verschiedenen Ebenen zu lernen. Darüber hinaus wurde ein gewichteter Kreuzentropieverlust entwickelt, um das Training effektiver zu gestalten. Wir verwenden zwei gängige Benchmark-Datensätze für die Schattenerkennung und führen verschiedene Experimente durch, um unser Netzwerk zu evaluieren. Die experimentellen Ergebnisse zeigen, dass unser Netzwerk die besten bisher bekannten Methoden übertrifft und eine Genauigkeit von 97 % sowie eine Reduktion des ausbalancierten Fehlerrates um 38 % erreicht.