
반감독 객체 탐지(Semi-Supervised Object Detection, SSOD)는 R-CNN 계열 및 앵커 기반 탐지기 모두의 성능 향상에 성공적으로 기여해왔다. 그러나 단계별 앵커 기반 탐지기는 고품질 또는 유연한 의사 레이블(pseudo label)을 생성할 수 있는 구조가 부족하여 SSOD에서 심각한 일관성 문제를 야기한다. 본 논문에서는 확장 가능하고 효과적인 단계별 앵커 기반 SSOD 학습을 위한 효율적인 트레이너(Efficient Teacher) 프레임워크를 제안한다. 이 프레임워크는 Dense Detector, Pseudo Label Assigner, Epoch Adaptor로 구성된다. Dense Detector는 YOLOv5의 밀집 샘플링 기법을 참고하여 RetinaNet을 확장한 기준 모델이다. Efficient Teacher 프레임워크는 Dense Detector에서 생성된 의사 레이블을 보다 정교하게 활용하는 새로운 의사 레이블 할당 메커니즘인 Pseudo Label Assigner를 도입한다. 또한 Epoch Adaptor는 Dense Detector에 대해 안정적이고 효율적인 엔드투엔드 반감독 학습 스케줄을 가능하게 하는 방법이다. Pseudo Label Assigner는 학생-교사 상호 학습 메커니즘 중에서 저품질 의사 레이블의 과도한 축적으로 인한 편향을 방지하고, Epoch Adaptor는 도메인 및 분포 적응을 활용하여 Dense Detector가 전역적으로 일관된 특징을 학습할 수 있도록 하여 라벨링된 데이터 비율에 의존하지 않는 학습을 가능하게 한다. 실험 결과, Efficient Teacher 프레임워크는 이전 방법보다 더 적은 FLOPs를 사용하여 VOC, COCO-standard, COCO-additional에서 최신 기준(SOTA) 성능을 달성하였다. 우리 지식상으로는, 본 연구가 YOLOv5에 반감독 객체 탐지 기법을 적용한 최초의 시도이다. 코드는 다음과 같이 공개되어 있다: https://github.com/AlibabaResearch/efficientteacher