Command Palette
Search for a command to run...
Bidirektionales Merkmals-Pyramiden-Netzwerk mit rekurrenten Aufmerksamkeits-Residual-Modulen für die Schatten-Detektion
Bidirektionales Merkmals-Pyramiden-Netzwerk mit rekurrenten Aufmerksamkeits-Residual-Modulen für die Schatten-Detektion
Xiao-Wei Hu Pheng-Ann Heng Chi-Wing Fu Zijun Deng Lei Zhu Xuemiao Xu Jing Qin
Zusammenfassung
Diese Arbeit präsentiert ein Netzwerk zur Schattenerkennung, das globale Kontextinformationen aus tiefen Schichten und lokale Kontextinformationen aus flachen Schichten eines tiefen konvolutionellen neuronalen Netzwerks (CNN) erforscht und kombiniert. Unser Netzwerkkonzept weist zwei technische Beiträge auf. Erstens formulieren wir das rekurrente Aufmerksamkeits-Residual-(RAR)-Modul, um Kontextinformationen aus zwei benachbarten CNN-Schichten zu kombinieren und eine Aufmerksamkeitskarte zu lernen, um ein Residual auszuwählen und die Kontextmerkmale zu verfeinern. Zweitens entwickeln wir ein bidirektionales Merkmalspyramiden-Netzwerk (BFPN), das Schattenkontexte über verschiedene CNN-Schichten hinweg aggregiert, indem zwei Serien von RAR-Modulen im Netzwerk eingesetzt werden, um die Kontextmerkmale iterativ zu kombinieren und zu verfeinern: Eine Serie verfeinert die Kontextmerkmale von tiefen zu flachen Schichten, die andere Serie von flachen zu tiefen Schichten. Dadurch können wir sowohl Falschdetektionen besser unterdrücken als auch Schattendetails stärker hervorheben. Wir evaluieren unser Netzwerk an zwei gängigen Benchmark-Datensätzen für Schattenerkennung: SBU und UCF. Experimentelle Ergebnisse zeigen, dass unser Netzwerk die bisher beste Methode übertrifft, wobei sich die Balance-Fehlerquote auf SBU um 34,88 % und auf UCF um 34,57 % verringert.