2달 전
R-FCN: Region-based Fully Convolutional Networks을 이용한 객체 검출
Jifeng Dai; Yi Li; Kaiming He; Jian Sun

초록
우리는 정확하고 효율적인 객체 검출을 위해 지역 기반 완전 합성곱 네트워크를 제시합니다. 이전의 Fast/Faster R-CNN과 같은 지역 기반 검출기들은 비용이 많이 드는 지역별 하위 네트워크를 수백 번 적용하는 반면, 우리의 지역 기반 검출기는 거의 모든 계산을 전체 이미지에 공유하여 완전 합성곱입니다. 이를 달성하기 위해, 우리는 이미지 분류에서의 변환 불변성과 객체 검출에서의 변환 변동성 사이의 딜레마를 해결하기 위한 위치 감응 점수 맵(position-sensitive score maps)을 제안합니다. 따라서 우리의 방법은 객체 검출에 최신 잔차 네트워크(Residual Networks, ResNets)와 같은 완전 합성곱 이미지 분류기 백본을 자연스럽게 채택할 수 있습니다. 101층 ResNet을 사용하여 PASCAL VOC 데이터셋에서 경쟁력 있는 결과(예: 2007 데이터셋에서 83.6% mAP)를 보여줍니다. 또한, 테스트 시각 속도는 이미지당 170ms로, Faster R-CNN 대비 2.5-20배 빠릅니다. 코드는 다음과 같이 공개되어 있습니다: https://github.com/daijifeng001/r-fcn