11일 전

MUM: 반응형 이미지 타일과 비반응형 특징 타일을 활용한 반감독 객체 탐지

JongMok Kim, Jooyoung Jang, Seunghyeon Seo, Jisoo Jeong, Jongkeun Na, Nojun Kwak
MUM: 반응형 이미지 타일과 비반응형 특징 타일을 활용한 반감독 객체 탐지
초록

최근의 반감독 학습(semi-supervised learning, SSL) 연구들은 일반적으로 트레이너-스튜던트 아키텍처를 구축하고, 트레이너로부터 생성된 감독 신호를 활용하여 스튜던트 네트워크를 훈련한다. 데이터 증강(data augmentation) 전략은 SSL 프레임워크에서 중요한 역할을 하며, 레이블 정보를 잃지 않고 약한-강한 증강 입력 쌍을 생성하는 것이 어렵기 때문이다. 특히 반감독 객체 탐지(semi-supervised object detection, SSOD)로 확장할 경우, 이미지 기하학적 변형 및 보간 정규화(interpolation-regularization)와 관련된 많은 강력한 증강 기법을 활용하기 어려운데, 이는 객체 탐지 작업에서 바운딩 박스의 위치 정보를 손상시킬 수 있기 때문이다. 이를 해결하기 위해, 우리는 SSOD 프레임워크에서 혼합된 이미지 타일을 특징 공간에서 재구성할 수 있도록, 특징 타일을 해독(de-mix)하는 간단하면서도 효과적인 데이터 증강 방법인 Mix/UnMix(MUM)을 제안한다. 제안한 방법은 혼합된 입력 이미지 타일을 생성하고, 이를 특징 공간에서 재구성함으로써, 비보간된 가짜 레이블(pseudo-label)로부터 보간 정규화 효과를 누릴 수 있다. 또한 의미 있는 약한-강한 쌍을 성공적으로 생성할 수 있다. 더불어 MUM은 다양한 SSOD 방법에 쉽게 통합될 수 있다. MS-COCO 및 PASCAL VOC 데이터셋에서 실시한 광범위한 실험을 통해, MUM은 모든 테스트된 SSOD 벤치마크 프로토콜에서 기준 모델 대비 지속적으로 mAP 성능을 향상시킴으로써 그 우수성을 입증하였다.

MUM: 반응형 이미지 타일과 비반응형 특징 타일을 활용한 반감독 객체 탐지 | 최신 연구 논문 | HyperAI초신경