11일 전

컨시스턴트티처: 반감독 객체 탐지에서 일관되지 않은 가짜 타겟 감소를 위한 연구

Xinjiang Wang, Xingyi Yang, Shilong Zhang, Yijiang Li, Litong Feng, Shijie Fang, Chengqi Lyu, Kai Chen, Wayne Zhang
컨시스턴트티처: 반감독 객체 탐지에서 일관되지 않은 가짜 타겟 감소를 위한 연구
초록

본 연구에서는 반감독 객체 탐지(SSI, Semi-Supervised Object Detection)에서 가상 타겟(pseudo-target)의 일관성 부족 문제에 대해 심층적으로 탐구한다. 우리의 핵심 관찰은 진동하는 가상 타겟이 정확한 탐지기 학습을 약화시킨다는 점이다. 이는 학습자(student) 모델의 학습 과정에 노이즈를 주입하여 심각한 과적합 문제를 유발한다. 따라서 이러한 일관성 부족을 줄이기 위한 체계적인 해결책인 ConsistentTeacher를 제안한다. 첫째, 정적 IoU 기반 전략을 대체하는 적응형 앵커 할당(Adaptive Anchor Assignment, ASA)을 도입함으로써 학습자 네트워크가 노이즈가 포함된 가상 경계상자(pseudo-bounding boxes)에 대해 강건해질 수 있도록 한다. 둘째, 3차원 특징 정렬 모듈(3D Feature Alignment Module, FAM-3D)을 설계하여 하위 작업의 예측을 보정한다. 이 모듈은 각 분류 특징이 임의의 스케일과 위치에서 회귀 작업에 최적의 특징 벡터를 적응적으로 검색할 수 있도록 한다. 셋째, 가우시안 혼합 모델(Gaussian Mixture Model, GMM)을 활용하여 가상 박스의 점수 임계값을 동적으로 조정함으로써 초기 학습 단계에서 참값의 수를 안정화하고, 학습 과정 중 신뢰할 수 없는 감독 신호를 보완한다. ConsistentTeacher는 다양한 반감독 객체 탐지 평가에서 강력한 성능을 보이며, 레이저-50 기반 모델을 사용해 MS-COCO 데이터셋의 단지 10%에 대한 레이블만을 활용해 40.0 mAP를 달성한다. 이는 이전의 가상 레이블 기반 베이스라인보다 약 3 mAP 높은 성능이다. 전체적으로 레이블이 제공된 MS-COCO 데이터셋에 추가로 비라벨 데이터를 사용해 학습할 경우 성능은 더욱 향상되어 47.7 mAP에 도달한다. 본 연구의 코드는 \url{https://github.com/Adamdad/ConsistentTeacher}에서 공개되어 있다.

컨시스턴트티처: 반감독 객체 탐지에서 일관되지 않은 가짜 타겟 감소를 위한 연구 | 최신 연구 논문 | HyperAI초신경