개체별 대조 학습과 회귀 불확실성을 활용한 반감독 객체 탐지

반감독 객체 탐지(Semi-supervised Object Detection, SSOD)는 추가적인 레이블이 없는 데이터를 활용하여 탐지 성능을 향상시키는 것을 목표로 한다. 교사-학생 프레임워크는 SSOD에 있어 유망한 접근 방식으로 입증되었으며, 이 프레임워크에서는 교사 네트워크가 레이블이 없는 데이터에 대해 의사 레이블(pseudo-labels)을 생성하여 학생 네트워크의 학습을 지원한다. 그러나 이러한 의사 레이블은 노이즈가 포함되어 있어, 이를 효과적으로 필터링하는 것이 이 프레임워크의 잠재력을 극대화하는 데 핵심적인 요소이다. 기존의 비최적화된 방법들과는 달리, 본 연구에서는 교사-학생 프레임워크 내에서 분류 헤드와 회귀 헤드에 대해 두 단계의 의사 레이블 필터링을 제안한다. 분류 헤드에 대해서는, 객체별 대조 학습(Object-wise Contrastive Learning, OCL)을 도입하여, 레이블이 없는 데이터를 활용한 객체 표현 학습을 정규화함으로써 분류 점수의 구별력을 향상시켜 의사 레이블 필터링을 개선한다. 이는 동일한 클래스에 속한 객체들을 서로 가깝게, 다른 클래스의 객체들을 서로 멀리 떨어지게 하는 방식으로 설계되었다. 회귀 헤드에 대해서는, 객체 위치 추정의 알레아토릭 불확실성(aleatoric uncertainty)을 학습하는 RUPL(Regression-Uncertainty-guided Pseudo-Labeling)을 추가로 제안하여 레이블 필터링을 더욱 정교하게 구현한다. 분류 및 회귀 헤드에 대해 공동으로 의사 레이블을 필터링함으로써, 학생 네트워크는 교사 네트워크로부터 더 정교한 안내를 받게 되어 객체 탐지 작업에서 향상된 성능을 달성할 수 있다. Pascal VOC 및 MS-COCO 데이터셋에서 수행한 실험 결과는 제안한 방법이 기존 방법과 경쟁 가능한 성능을 보이며, 우수한 성능을 입증하였다.