HyperAIHyperAI
vor 2 Monaten

R-FCN: Objekterkennung durch regionsbasierte vollkonvolutionale Netze

Jifeng Dai; Yi Li; Kaiming He; Jian Sun
R-FCN: Objekterkennung durch regionsbasierte vollkonvolutionale Netze
Abstract

Wir präsentieren regionsbasierte, vollständig konvolutive Netzwerke für genaue und effiziente Objekterkennung. Im Gegensatz zu früheren regionsbasierten Detektoren wie Fast/Faster R-CNN, die ein aufwendiges pro-Region-Unternetzwerk Hunderte von Malen anwenden, ist unser regionsbasierter Detektor fast vollständig konvolutiv mit nahezu allen Berechnungen, die auf dem gesamten Bild geteilt werden. Um dieses Ziel zu erreichen, schlagen wir translationsensitive Bewertungskarten vor, um das Dilemma zwischen translationsinvarianter Bildklassifikation und translationsvariabler Objekterkennung zu lösen. Unsere Methode kann daher natürlicherweise vollständig konvolutive Bildklassifikator-Rückgratnetze wie die neuesten Residual Networks (ResNets) für die Objekterkennung verwenden. Wir zeigen wettbewerbsfähige Ergebnisse auf den PASCAL VOC-Datensätzen (z.B. 83,6 % mAP auf dem Datensatz von 2007) mit dem 101-schichtigen ResNet. Gleichzeitig wird unser Ergebnis bei einer Testgeschwindigkeit von 170 ms pro Bild erzielt, was 2,5-20-mal schneller ist als der entsprechende Faster R-CNN-Detektor. Der Quellcode ist öffentlich verfügbar unter: https://github.com/daijifeng001/r-fcn