11일 전
혼합 가상 레이블을 활용한 반감독 객체 탐지
Zeming Chen, Wenwei Zhang, Xinjiang Wang, Kai Chen, Zhi Wang

초록
반가운 라벨 방법은 반감독 객체 탐지 작업에서 상당한 성공을 거두었음에도 불구하고, 본 논문은 이 접근법 내에 존재하는 중요한 한계를 밝혀냈다. 구체적으로, 반가운 라벨 방법은 탐지기의 내재적 강점을 강화하면서도 약점을 더욱 부각시키는 경향이 있으며, 이는 특히 소형 객체 및 테일 카테고리 객체에 대한 반가운 라벨의 탐지 누락 현상으로 나타난다. 이러한 문제를 극복하기 위해, 본 논문은 반가운 라벨 데이터에 대해 Mixup과 Mosaic를 결합한 혼합 반가운 라벨(Mixed Pseudo Labels, MixPL)을 제안한다. 이 방법은 탐지 누락이 초래하는 부정적 영향을 완화하고, 다양한 객체 규모에 걸쳐 모델의 학습 균형을 개선하는 데 기여한다. 또한, 관련된 인스턴스를 활용한 레이블 데이터의 재표본화를 통해 테일 카테고리 객체에 대한 탐지 성능을 향상시킨다. 특히, MixPL은 다양한 탐지기에서 일관되게 성능을 향상시키며, COCO-Standard 및 COCO-Full 벤치마크에서 Faster R-CNN, FCOS, DINO 모델을 사용하여 새로운 최고 성능 기록을 달성하였다. 더불어, 대규모 모델에 대해서도 우수한 확장성을 보이며, DINO Swin-L의 경우 2.5%의 mAP 향상을 기록했으며, 추가적인 레이블 없이도 COCO val2017 벤치마크에서 60.2% mAP라는 의미 있는 새로운 기록을 달성하였다.