
부분적으로 가려진 물체를 탐지하는 것은 여전히 최첨단 물체 탐지기의 도전 과제로 남아 있다. 본 연구의 목적은 이러한 가려진 물체에 대한 탐지 성능을 향상시켜, 현대적인 물체 탐지기의 전반적인 성능을 개선하는 것이다.이를 위해 다음과 같은 네 가지 기여를 한다. (1) 두 단계형 물체 탐지기의 탐지 헤드에 간단한 ‘플러그인(Plugin)’ 모듈을 제안한다. 이 모듈은 부분적으로 가려진 물체의 재현율(Recall)을 향상시키는 데 기여하며, 타깃 물체, 가려는 물체(occluder), 가려진 물체(occludee)의 세 층의 세그멘테이션 마스크를 예측한다. 이를 통해 타깃 물체의 마스크를 더 정확히 예측할 수 있다. (2) 기존의 물체 탐지 및 인스턴스 세그멘테이션 학습 데이터셋을 활용하여 무모달 완성(amodal completion) 기법을 적용함으로써, 가려짐 관계를 설정하고, 이 모듈을 위한 훈련 데이터를 확장 가능한 파이프라인으로 생성하는 방법을 제안한다. (3) 부분적으로 가려진 물체 및 분리된 물체에 대한 재현율 성능을 측정할 수 있도록 COCO 평가 데이터셋을 구축하였다. (4) 두 단계형 탐지기에 플러그인 모듈을 삽입하면, 탐지 헤드만 미세 조정(fine-tuning)함으로써 성능이 크게 향상되며, 전체 아키텍처까지 미세 조정할 경우 추가적인 성능 향상이 가능함을 보였다. 실험 결과는 Swin-T 또는 Swin-S 백본을 사용한 Mask R-CNN, 그리고 Swin-B 백본을 사용한 Cascade Mask R-CNN에 대해 보고하였다.