7일 전

차선이 가려진 탐지 성능을 향상시키기 위한 3층 플러그인

Guanqi Zhan, Weidi Xie, Andrew Zisserman
차선이 가려진 탐지 성능을 향상시키기 위한 3층 플러그인
초록

부분적으로 가려진 물체를 탐지하는 것은 여전히 최첨단 물체 탐지기의 도전 과제로 남아 있다. 본 연구의 목적은 이러한 가려진 물체에 대한 탐지 성능을 향상시켜, 현대적인 물체 탐지기의 전반적인 성능을 개선하는 것이다.이를 위해 다음과 같은 네 가지 기여를 한다. (1) 두 단계형 물체 탐지기의 탐지 헤드에 간단한 ‘플러그인(Plugin)’ 모듈을 제안한다. 이 모듈은 부분적으로 가려진 물체의 재현율(Recall)을 향상시키는 데 기여하며, 타깃 물체, 가려는 물체(occluder), 가려진 물체(occludee)의 세 층의 세그멘테이션 마스크를 예측한다. 이를 통해 타깃 물체의 마스크를 더 정확히 예측할 수 있다. (2) 기존의 물체 탐지 및 인스턴스 세그멘테이션 학습 데이터셋을 활용하여 무모달 완성(amodal completion) 기법을 적용함으로써, 가려짐 관계를 설정하고, 이 모듈을 위한 훈련 데이터를 확장 가능한 파이프라인으로 생성하는 방법을 제안한다. (3) 부분적으로 가려진 물체 및 분리된 물체에 대한 재현율 성능을 측정할 수 있도록 COCO 평가 데이터셋을 구축하였다. (4) 두 단계형 탐지기에 플러그인 모듈을 삽입하면, 탐지 헤드만 미세 조정(fine-tuning)함으로써 성능이 크게 향상되며, 전체 아키텍처까지 미세 조정할 경우 추가적인 성능 향상이 가능함을 보였다. 실험 결과는 Swin-T 또는 Swin-S 백본을 사용한 Mask R-CNN, 그리고 Swin-B 백본을 사용한 Cascade Mask R-CNN에 대해 보고하였다.

차선이 가려진 탐지 성능을 향상시키기 위한 3층 플러그인 | 최신 연구 논문 | HyperAI초신경