Command Palette
Search for a command to run...
Shaoqing Ren; Kaiming He; Ross Girshick; Jian Sun

초록
최신 객체 검출 네트워크는 객체 위치를 가정하기 위해 영역 제안 알고리즘에 의존합니다. SPPnet 및 Fast R-CNN과 같은 발전은 이러한 검출 네트워크의 실행 시간을 줄였지만, 영역 제안 계산이 병목 현상으로 드러났습니다. 본 연구에서는 전체 이미지 합성곱 특성을 검출 네트워크와 공유하여 거의 비용 없이 영역 제안을 가능하게 하는 Region Proposal Network (RPN)를 소개합니다. RPN은 각 위치에서 동시에 객체 경계와 객체성 점수를 예측하는 완전 합성곱 네트워크입니다. RPN은 끝까지 학습되어 고품질의 영역 제안을 생성하며, 이 제안들은 Fast R-CNN에서 검출에 사용됩니다. 우리는 그들의 합성곱 특성을 공유하여 RPN과 Fast R-CNN을 단일 네트워크로 통합하였습니다. 최근 인기 있는 '어텐션' 메커니즘을 갖춘 신경망 용어로 표현하면, RPN 구성요소는 통합된 네트워크가 어디를 주시해야 하는지를 알려줍니다. 매우 깊은 VGG-16 모델에 대해 우리의 검출 시스템은 GPU에서 모든 단계를 포함해 5프레임/초(fps)의 프레임 속도를 가지며, 이미지당 300개의 제안만으로 PASCAL VOC 2007, 2012 및 MS COCO 데이터셋에서 최고 수준의 객체 검출 정확도를 달성하였습니다. ILSVRC 및 COCO 2015 경쟁에서 Faster R-CNN과 RPN은 여러 트랙에서 1위를 차지한 입상작의 기반이 되었습니다. 코드는 공개적으로 제공되었습니다.
코드 저장소
벤치마크
| 벤치마크 | 방법론 | 지표 |
|---|---|---|
| 2d-object-detection-on-sardet-100k | F-RCNN | box mAP: 49.0 |
| object-counting-on-carpk | Faster R-CNN (2015) | MAE: 39.88 RMSE: 47.67 |
| object-detection-on-coco-o | Faster R-CNN (ResNet-50-FPN) | Average mAP: 16.4 Effective Robustness: -0.41 |
| object-detection-on-pascal-voc-2007-15-5 | Faster R-CNN | MAP: 73.2% |
| object-detection-on-pku-ddd17-car-1 | Faster-RCNN | mAP50: 80.2 |
| object-detection-on-ua-detrac | Faster R-CNN | mAP: 58.45 |
| real-time-object-detection-on-pascal-voc-2007-1 | Faster R-CNN | FPS: 7.0 MAP: 73.2 |
| robust-object-detection-on-cityscapes-1 | Baseline | mPC [AP]: 15.4 |
| vessel-detection-on-vessel-detection-dateset | Faster RCNN | AP: 64.3% |