16일 전

엔드투엔드 세미서포티드 오브젝트 디텍션: 소프트 티처를 활용한 방법

Mengde Xu, Zheng Zhang, Han Hu, Jianfeng Wang, Lijuan Wang, Fangyun Wei, Xiang Bai, Zicheng Liu
엔드투엔드 세미서포티드 오브젝트 디텍션: 소프트 티처를 활용한 방법
초록

이 논문은 기존의 더 복잡한 다단계 방법들과는 달리, 엔드투엔드(semi-supervised) 객체 탐지 접근법을 제안한다. 엔드투엔드 학습은 커리큘럼 과정 동안 점차적으로 의사 레이블( pseudo-label)의 품질을 향상시키며, 그 결과 보다 정확한 의사 레이블이 객체 탐지 학습에 긍정적인 영향을 미친다. 또한 본 연구에서는 이 프레임워크 내에서 간단하면서도 효과적인 두 가지 기법을 제안한다. 첫째, 소프트 테이처(soft teacher) 메커니즘으로, 각 미레이블링된 경계상자에 대한 분류 손실을 테이처 네트워크가 생성한 분류 점수에 따라 가중치를 부여한다. 둘째, 박스 제트팅(box jittering) 기법을 통해 박스 회귀 학습에 사용할 신뢰도가 높은 의사 박스를 선별한다. COCO 벤치마크에서 제안된 방법은 다양한 레이블링 비율(1%, 5%, 10%) 하에서 기존 방법들보다 큰 성능 차이를 보였다. 또한, 레이블링 데이터의 양이 상대적으로 많을 경우에도 본 방법이 우수한 성능을 발휘함을 입증하였다. 예를 들어, 전체 COCO 학습 세트를 사용해 학습한 기준 모델(40.9 mAP)에 COCO의 123,000개 미레이블링 이미지를 활용함으로써 +3.6 mAP의 성능 향상을 기록하며, 최종적으로 44.5 mAP에 도달하였다. 또한 최신의 Swin Transformer 기반 객체 탐지기(테스트-데브에서 58.9 mAP)에 적용했을 때, 탐지 정확도를 +1.5 mAP 향상시켜 60.4 mAP를 달성하였으며, 인스턴스 세그멘테이션 정확도도 +1.2 mAP 향상되어 52.4 mAP에 도달하였다. 더욱이 Object365에서 사전 학습된 모델을 결합하면 탐지 정확도는 61.3 mAP, 인스턴스 세그멘테이션 정확도는 53.0 mAP까지 향상되어 새로운 최고 성능(SOTA)을 달성하였다.

엔드투엔드 세미서포티드 오브젝트 디텍션: 소프트 티처를 활용한 방법 | 최신 연구 논문 | HyperAI초신경