4달 전

정밀도가 중요하다: 약한 감독 하위 의미 분할을 위한 정밀도 인식 앙상블

Junsung Park; Hyunjung Shim
정밀도가 중요하다: 약한 감독 하위 의미 분할을 위한 정밀도 인식 앙상블
초록

약한 감독을 사용하는 의미 분할(Weakly Supervised Semantic Segmentation, WSSS)은 이미지 레벨 라벨과 같은 약한 지도를 활용하여 분할 모델을 학습합니다. 최근의 WSSS 방법들이 인상적인 성과를 거두었음에도 불구하고, 우리는 고 평균 교집합 비율(mean Intersection of Union, mIoU)을 가진 약한 라벨을 도입한다고 해서 반드시 높은 분할 성능을 보장하지 않는다는 점을 확인하였습니다. 기존 연구들은 전체 성능 향상을 위해 정밀도를 우선시하고 노이즈를 줄이는 것이 중요하다는 점을 강조해 왔습니다. 이와 같은 맥락에서, 우리는 WSSS에 특화된 고급 앙상블 접근 방식인 ORANDNet을 제안합니다. ORANDNet은 두 가지 다른 분류기에서 얻은 클래스 활성화 맵(Class Activation Maps, CAMs)을 결합하여 의사 마스크(pseudo-masks, PMs)의 정밀도를 높입니다. 또한 PMs의 작은 노이즈를 더욱 줄이기 위해 커리큘럼 학습(curriculum learning)을 통합하였습니다. 이는 초기에는 크기가 작은 이미지와 해당 PMs 쌍으로 분할 모델을 학습시키고, 점차 원래 크기의 쌍으로 전환하는 과정을 포함합니다. ResNet-50와 ViT의 원래 CAMs를 결합함으로써 우리는 각각 단일 최적 모델과 단순 앙상블 모델보다 분할 성능을 크게 개선했습니다. 이를 바탕으로 우리는 AMN(ResNet 유사) 및 MCTformer(ViT 유사) 모델에서 얻은 CAMs까지 앙상블 방법을 확장하여 고급 WSSS 모델에서 성능 향상을 달성하였습니다. 이러한 결과는 ORANDNet이 WSSS 모델의 최종 추가 모듈로서의 잠재력을 강조합니다.