2달 전
Faster R-CNN: Region Proposal Networks을 이용한 실시간 객체 검출에 대한 연구
Shaoqing Ren; Kaiming He; Ross Girshick; Jian Sun

초록
최신 객체 검출 네트워크는 객체 위치를 가정하기 위해 영역 제안 알고리즘에 의존합니다. SPPnet 및 Fast R-CNN과 같은 발전은 이러한 검출 네트워크의 실행 시간을 줄였지만, 영역 제안 계산이 병목 현상으로 드러났습니다. 본 연구에서는 전체 이미지 합성곱 특성을 검출 네트워크와 공유하여 거의 비용 없이 영역 제안을 가능하게 하는 Region Proposal Network (RPN)를 소개합니다. RPN은 각 위치에서 동시에 객체 경계와 객체성 점수를 예측하는 완전 합성곱 네트워크입니다. RPN은 끝까지 학습되어 고품질의 영역 제안을 생성하며, 이 제안들은 Fast R-CNN에서 검출에 사용됩니다. 우리는 그들의 합성곱 특성을 공유하여 RPN과 Fast R-CNN을 단일 네트워크로 통합하였습니다. 최근 인기 있는 '어텐션' 메커니즘을 갖춘 신경망 용어로 표현하면, RPN 구성요소는 통합된 네트워크가 어디를 주시해야 하는지를 알려줍니다. 매우 깊은 VGG-16 모델에 대해 우리의 검출 시스템은 GPU에서 모든 단계를 포함해 5프레임/초(fps)의 프레임 속도를 가지며, 이미지당 300개의 제안만으로 PASCAL VOC 2007, 2012 및 MS COCO 데이터셋에서 최고 수준의 객체 검출 정확도를 달성하였습니다. ILSVRC 및 COCO 2015 경쟁에서 Faster R-CNN과 RPN은 여러 트랙에서 1위를 차지한 입상작의 기반이 되었습니다. 코드는 공개적으로 제공되었습니다.