CW-BASS: 반응형 신뢰도 가중 경계 인지 학습을 통한 반자율적 세분화

반감독(semi-supervised) 의미 분할(Semi-supervised Semantic Segmentation, SSSS)은 제한된 레이블 데이터를 바탕으로 대량의 비라벨 데이터를 활용하여 분할 성능을 향상시키는 것을 목표로 한다. 기존의 방법들은 초기 레이블 데이터에 과도하게 의존함으로써 학습이 비최적화되는 '결합(coupling)' 문제, 잘못된 예측이 반복적으로 강화되는 '확인 편향(confirmation bias)' 문제, 그리고 경계 인식 능력이 제한되고 경계 신호가 모호한 상황에서 발생하는 '경계 흐림(boundary blur)' 문제를 겪는다. 이러한 문제들을 해결하기 위해, 본 연구는 SSSS를 위한 새로운 프레임워크인 CW-BASS를 제안한다. 잘못된 예측의 영향을 완화하기 위해, 우리는 의사 레이블(pseudo-labels)에 신뢰도 가중치(confidence weights)를 부여한다. 또한, 약한 감독 의미 분할(Weakly-supervised Semantic Segmentation, WSSS) 분야에서 널리 연구되어 왔지만 SSSS에서는 여전히 미흡하게 활용되고 있는 경계 구분 기법(boundary-delineation techniques)을 활용한다. 구체적으로 제안하는 방법은 다음과 같다: (1) 의사 레이블의 예측 신뢰도에 따라 영향력을 조정하는 신뢰도 가중 손실(confidence-weighted loss)을 통해 결합 문제를 완화하고, (2) 모델 성능에 따라 의사 레이블을 필터링할 수 있도록 동적 임계값 설정(dynamic thresholding mechanism)을 도입하여 확인 편향을 완화하며, (3) 객체 경계 근처의 분할 정밀도를 향상시키기 위해 경계 인식 모듈(boundary-aware module)을 도입하여 경계 흐림 문제를 해결하고, (4) 학습 과정에서 의사 레이블을 점진적으로 정제하는 신뢰도 감쇠(confidence decay) 전략을 통해 레이블 노이즈를 줄인다. Pascal VOC 2012 및 Cityscapes에서 실시한 광범위한 실험 결과, CW-BASS는 최신 기준(SOTA) 성능을 달성함을 입증하였다. 특히, 도전적이고 연구가 미흡한 1/30(3.3%, 100장) 데이터 분할 조건에서 Cityscapes에서 65.9%의 mIoU를 기록하며, 레이블이 극히 제한된 환경에서도 뛰어난 성능을 발휘함을 보여준다. 본 연구의 코드는 https://github.com/psychofict/CW-BASS 에 공개되어 있다.