11일 전
객체 탐지를 위한 간단한 반감독 학습 프레임워크
Kihyuk Sohn, Zizhao Zhang, Chun-Liang Li, Han Zhang, Chen-Yu Lee, Tomas Pfister

초록
반감독 학습(Semi-supervised learning, SSL)은 레이블이 없는 데이터를 활용하여 머신러닝 모델의 예측 성능을 향상시킬 수 있는 잠재력을 지닌다. 최근 몇 년간 큰 발전이 있었지만, SSL의 적용 범위는 주로 이미지 분류 작업에 국한되어 있었다. 본 논문에서는 시각적 객체 탐지에 적합한 간단하면서도 효과적인 SSL 프레임워크인 STAC과 함께 데이터 증강 전략을 제안한다. STAC은 레이블이 없는 이미지에서 지역화된 객체에 대해 높은 신뢰도를 가진 가짜 레이블(pseudo labels)을 생성하고, 강한 데이터 증강을 통해 일관성(coherence)을 강제함으로써 모델을 업데이트한다. MS-COCO 데이터셋을 활용한 반감독 객체 탐지 성능 평가를 위한 실험 프로토콜을 제안하며, STAC이 MS-COCO와 VOC07 모두에서 우수한 성능을 보임을 실험적으로 입증한다. VOC07에서 STAC은 AP$^{0.5}$를 76.30에서 79.08로 향상시켰고, MS-COCO에서는 레이블이 있는 데이터의 양이 10%인 감독 학습 기준 모델(23.86 mAP)보다 단지 5%의 레이블 데이터만 사용함에도 불구하고 24.38 mAP를 달성하여 데이터 효율성 측면에서 2배 이상의 성능 향상을 보였다. 코드는 https://github.com/google-research/ssl_detection/ 에 공개되어 있다.