11일 전

엔드투엔드 반감독 객체 탐지에서 클래스 불균형 재고찰

Purbayan Kar, Vishal Chudasama, Naoyuki Onoe, Pankaj Wasnik
엔드투엔드 반감독 객체 탐지에서 클래스 불균형 재고찰
초록

반감독 객체 탐지(Semi-supervised Object Detection, SSOD)는 의사라벨 기반의 엔드투엔드 방법의 발전에 따라 큰 진전을 이루었다. 그러나 이러한 방법들 중 다수는 클래스 불균형 문제로 인해 의사라벨 생성기의 효과성이 저하되는 도전에 직면해 있다. 또한 기존 연구에서는 저품질의 의사라벨이 SSOD 성능을 심각하게 제한한다는 점이 관찰되었다. 본 논문에서는 저품질 의사라벨의 근본 원인을 분석하고, 라벨 생성 품질을 향상시키기 위한 새로운 학습 메커니즘을 제안한다. 높은 거짓음성률(false-negative rate)과 낮은 정밀도(precision rate) 문제를 해결하기 위해, 최적의 바운딩 박스를 필터링할 수 있도록 적응형 임계값 기반 메커니즘을 도입한다. 또한, 바운딩 박스의 정밀한 위치 정보를 제공하여 개선하는 데 기여하는 Jitter-Bagging 모듈을 제안한다. 더불어, 교사 및 학습자 네트워크가 예측한 배경 및 전경 점수를 활용하여 두 가지 새로운 손실 함수를 도입함으로써 의사라벨의 재현율(recall rate)을 향상시킨다. 또한, 강한 및 약한 증강 데이터를 동시에 입력하여 교사 네트워크에 엄격한 감독을 적용함으로써, 소형 및 복잡한 객체까지도 효과적으로 탐지할 수 있도록 강력한 의사라벨을 생성하도록 한다. 마지막으로, 광범위한 실험을 통해 제안된 네트워크가 MS-COCO 및 Pascal VOC 데이터셋에서 최첨단 기법들을 상회함을 입증하였으며, 라벨링 데이터를 기존의 20% 수준으로 줄였음에도 기준 모델이 100% 감독 학습 성능에 도달할 수 있음을 보였다.

엔드투엔드 반감독 객체 탐지에서 클래스 불균형 재고찰 | 최신 연구 논문 | HyperAI초신경