
초록
본 논문에서는 정확한 객체 검출을 위해 그리드 안내 위치 결정 메커니즘을 채택한 새로운 객체 검출 프레임워크인 Grid R-CNN을 제안합니다. 전통적인 회귀 기반 방법과 달리, Grid R-CNN은 공간 정보를 명시적으로 포착하고 완전히 합성곱 구조의 위치 감응 특성을 활용합니다. 두 개의 독립된 점만 사용하는 대신, 우리는 더 많은 단서를 인코딩하여 특정 점의 예측 부정확성의 영향을 줄이기 위한 다중 점 감독 공식을 설계하였습니다. 그리드 내 점들의 상관관계를 최대한 활용하기 위해, 이웃 그리드 점들의 피처 맵을 융합하는 두 단계 정보 융합 전략을 제안하였습니다. 그리드 안내 위치 결정 접근법은 다양한 최신 검출 프레임워크로 확장하기 쉽습니다. 실험 결과, Grid R-CNN은 COCO 벤치마크에서 Res50 백본과 FPN 구조를 사용한 Faster R-CNN에 비해 IoU=0.8에서 4.1% AP 증가와 IoU=0.9에서 10.0% AP 증가를 달성하였습니다.