FCOS: Fully Convolutional One-Stage Object Detection FCOS: 완전 합성곱 단일 스테이지 객체 검출

우리는 픽셀 단위 예측 방식으로 객체 검출을 수행하는 완전 컨볼루셔널 원스테이지 객체 검출기(Fully Convolutional One-Stage Object Detector, FCOS)를 제안합니다. 이는 의미론적 분할과 유사한 접근 방식입니다. 거의 모든 최신 객체 검출기(예: RetinaNet, SSD, YOLOv3, Faster R-CNN)는 사전 정의된 앵커 박스에 의존하지만, 우리의 제안된 검출기 FCOS는 앵커 박스와 프로포절(proposal) 없이 작동합니다. 사전 정의된 앵커 박스 집합을 제거함으로써, FCOS는 훈련 중 앵커 박스 간의 겹침 계산 등 복잡한 계산을 완전히 피할 수 있습니다. 더욱 중요한 점은, 최종 검출 성능에 매우 민감한 앵커 박스 관련 하이퍼파라미터들을 모두 피할 수 있다는 것입니다. 유일한 후처리 단계인 비최대 억제(Non-Maximum Suppression, NMS)만 사용하여, FCOS는 ResNeXt-64x4d-101과 함께 단일 모델 및 단일 스케일 테스트에서 44.7%의 AP(Average Precision)를 달성하며, 이전의 원스테이지 검출기를 크게 능가합니다. 우리는 처음으로 이러한 훨씬 더 간단하고 유연한 검출 프레임워크가 개선된 검출 정확도를 달성할 수 있음을 입증하였습니다. 우리는 제안된 FCOS 프레임워크가 다른 많은 인스턴스 레벨 작업들에 대해 간단하면서도 강력한 대안이 될 수 있기를 바랍니다. 코드는 다음 주소에서 이용 가능합니다: https://tinyurl.com/FCOSv1