11일 전

인스턴트-테칭: 엔드투엔드 반감독 학습 객체 탐지 프레임워크

Qiang Zhou, Chaohui Yu, Zhibin Wang, Qi Qian, Hao Li
인스턴트-테칭: 엔드투엔드 반감독 학습 객체 탐지 프레임워크
초록

감독 학습 기반의 객체 탐지 프레임워크는 많은 노동력이 필요한 수동 라벨링을 요구하며, 실제 응용 상황에서는 실현 가능성이 떨어질 수 있다. 반감독 학습 기반 객체 탐지(SSOD, Semi-Supervised Object Detection)는 레이블이 없는 데이터를 효과적으로 활용하여 모델 성능을 향상시킬 수 있어, 객체 탐지 모델의 실제 적용에 있어 매우 중요한 의미를 갖는다. 본 논문에서는 SSOD를 재검토하고, 각 학습 반복 과정에서 확장된 약한-강한 데이터 증강 기법을 활용한 즉시 의사 라벨링(instant pseudo labeling)을 통해 학습을 유도하는 완전한 엔드투엔드(end-to-end)且 효과적인 SSOD 프레임워크인 Instant-Teaching을 제안한다. 확인 편향(confirmation bias) 문제를 완화하고 의사 라벨의 품질을 향상시키기 위해, Instant-Teaching 기반의 공동 수정(co-rectify) 기법을 추가로 제안하였으며, 이를 Instant-Teaching$^*$로 표기한다. MS-COCO 및 PASCAL VOC 데이터셋에서 실시한 광범위한 실험을 통해 제안하는 프레임워크의 우수성을 입증하였다. 구체적으로, MS-COCO에서 레이블 데이터를 2%만 사용할 경우, 기존 최고 성능(SOTA) 방법 대비 4.2 mAP의 성능 향상을 달성하였다. 또한 MS-COCO의 전체 감독 정보를 활용하는 경우에도, 기존 SOTA 방법보다 약 1.0 mAP 높은 성능을 기록하였다. PASCAL VOC에서는 VOC07을 레이블 데이터로, VOC12를 비레이블 데이터로 사용했을 때, 5 mAP 이상의 성능 향상을 달성할 수 있었다.

인스턴트-테칭: 엔드투엔드 반감독 학습 객체 탐지 프레임워크 | 최신 연구 논문 | HyperAI초신경