
Ce document propose une méthode de réseau neuronal convolutif basée sur des régions rapide (Fast R-CNN) pour la détection d'objets. Fast R-CNN s'appuie sur les travaux précédents pour classer efficacement les propositions d'objets à l'aide de réseaux neuronaux convolutifs profonds. Par rapport aux travaux antérieurs, Fast R-CNN intègre plusieurs innovations visant à accélérer l'entraînement et le temps de test tout en améliorant la précision de détection. Fast R-CNN entraîne le réseau très profond VGG16 9 fois plus rapidement que R-CNN, est 213 fois plus rapide lors du temps de test, et obtient un mAP (mean Average Precision) plus élevé sur PASCAL VOC 2012. Comparé à SPPnet, Fast R-CNN entraîne VGG16 3 fois plus rapidement, teste 10 fois plus rapidement, et est plus précis. Fast R-CNN est implémenté en Python et C++ (utilisant Caffe) et est disponible sous licence MIT open-source à l'adresse https://github.com/rbgirshick/fast-rcnn.