IterDet: 혼잡한 환경에서의 객체 탐지를 위한 반복적 방법

딥러닝 기반의 객체 탐지기는 일반적으로 동일한 객체에 대해 여러 중복되는 객체 경계 상자( bounding boxes)를 생성한다. 이러한 중복 상자들은 각 객체에 대해 정확히 하나의 경계 상자만 선택하기 위해 비최대 억제(Non-Maximum Suppression, NMS)를 통해 필터링된다. 이 탐욕적 방식은 고립된 객체에 대해 간단하고 충분한 정확도를 제공하지만, 혼잡한 환경에서는 종종 실패하게 되는데, 그 이유는 서로 다른 객체에 대한 상자를 보존하면서도 중복 탐지를 억제해야 하기 때문이다. 본 연구에서는 이 문제를 해결하기 위해 반복적(iterative)인 대안적 방식을 제안한다. 이 방식은 각 반복 단계에서 새로운 객체 서브셋을 탐지하며, 이전 반복 단계에서 탐지된 경계 상자들을 다음 반복에 네트워크에 입력함으로써 동일한 객체가 두 번 이상 탐지되지 않도록 보장한다. 이 반복적 구조는 단계별(one-stage) 및 이단계(two-stage) 객체 탐지기 모두에 적용 가능하며, 학습 및 추론 절차에 소규모 수정만으로도 가능하다. 본 연구에서는 네 가지 데이터셋에서 두 가지 다른 기준 탐지기(baseline detectors)를 사용하여 광범위한 실험을 수행하였으며, 기준 모델 대비 상당한 성능 향상을 입증하였으며, 특히 CrowdHuman 및 WiderPerson 데이터셋에서 최신 기술 수준(state-of-the-art)의 성능을 달성하였다. 소스 코드와 학습된 모델은 https://github.com/saic-vul/iterdet 에서 공개되어 있다.