11일 전

강력한 데이터 증강을 활용한 반감독 학습 세그멘테이션을 위한 간단한 베이스라인

Jianlong Yuan, Yifan Liu, Chunhua Shen, Zhibin Wang, Hao Li
강력한 데이터 증강을 활용한 반감독 학습 세그멘테이션을 위한 간단한 베이스라인
초록

최근에 의미 분할(semantic segmentation) 분야에서 중요한 진전이 이루어졌다. 그러나 기존의 감독 학습 기반 의미 분할 기법은 대량의 레이블링된 데이터에 의존하는 경우가 많으며, 이러한 데이터를 확보하는 것은 시간과 비용 측면에서 매우 비효율적이다. 이미지 분류 분야에서 반감독 학습(semi-supervised learning) 기법의 성공을 영감으로 삼아, 본 연구에서는 의미 분할을 위한 간단하면서도 효과적인 반감독 학습 프레임워크를 제안한다. 우리는 세부 사항이 성패를 결정함을 입증한다: 간단한 설계 및 학습 기법의 조합이 반감독 의미 분할의 성능을 상당히 향상시킬 수 있음을 보였다. 기존 연구들 [3, 27]은 강력한 증강(strong augmentation)을 의사 레이블 학습에 효율적으로 적용하지 못했는데, 그 이유는 강력한 증강이 초래하는 분포의 급격한 변화가 배치 정규화(batch normalisation) 통계량을 해칠 수 있기 때문이다. 이를 해결하기 위해 우리는 새로운 배치 정규화 기법인 분포 특화 배치 정규화(Distribution-Specific Batch Normalization, DSBN)를 설계하였으며, 의미 분할에서 강력한 증강의 중요성을 실험적으로 입증하였다. 또한, 노이즈에 강건한 성능을 보이는 자기 보정 손실(self-correction loss)을 제안하였다. 다양한 제거 연구(ablation studies)를 통해 각 구성 요소의 효과를 검증하였으며, 제안한 방법은 Cityscapes 및 Pascal VOC 데이터셋에서 반감독 설정에서 최신 기준(SOTA) 성능을 달성하였다.

강력한 데이터 증강을 활용한 반감독 학습 세그멘테이션을 위한 간단한 베이스라인 | 최신 연구 논문 | HyperAI초신경