11일 전
믹스티처: 혼합 스케일 티처를 통한 유망한 레이블 탐색을 위한 반감독 객체 탐지
Liang Liu, Boshen Zhang, Jiangning Zhang, Wuhao Zhang, Zhenye Gan, Guanzhong Tian, Wenbing Zhu, Yabiao Wang, Chengjie Wang

초록
객체 인스턴스 간 스케일 변동은 객체 탐지 과제에서 여전히 핵심적인 도전 과제로 남아 있다. 현대 탐지 모델의 놀라운 발전에도 불구하고, 이 문제는 특히 반감독 학습 환경에서 더욱 두드러진다. 기존의 반감독 객체 탐지 방법들은 네트워크 예측에서 고품질의 의사 레이블을 필터링하기 위해 엄격한 조건을 요구하지만, 우리는 극단적인 스케일을 가진 객체는 일반적으로 낮은 신뢰도를 보이며, 이러한 객체에 대한 긍정적 지도 정보가 부족해진다는 점을 관찰했다. 본 논문에서는 혼합 스케일 티처(mixed scale teacher)를 도입하여 의사 레이블 생성을 개선하고 스케일 불변 학습을 촉진함으로써 스케일 변동 문제를 해결하는 새로운 프레임워크를 제안한다. 또한, 다양한 스케일에서의 예측 결과에 대한 점수 증진을 활용하여 의사 레이블을 탐색하는 방법을 제안하며, 이는 혼합 스케일 특징에서 얻은 보다 우수한 예측에 기반한다. MS COCO 및 PASCAL VOC 기준에서 다양한 반감독 설정 하에서 수행한 광범위한 실험을 통해 제안한 방법이 새로운 최고 성능을 달성함을 입증하였다. 코드 및 모델은 \url{https://github.com/lliuz/MixTeacher}에서 공개되어 있다.