
초록
약한 감독 객체 위치 추정(Weakly Supervised Object Localization, WSOL) 기술은 위치 주석 없이 이미지 레벨 라벨만을 사용하여 객체의 위치를 학습합니다. 이러한 기술의 일반적인 제한점은 객체의 가장 구별되는 부분만을 다루고 전체 객체를 포함하지 않는다는 것입니다. 이 문제를 해결하기 위해, 우리는 자기 주의 메커니즘(self-attention mechanism)을 활용하여 모델의 특징 맵(feature maps)을 처리하는 주의 기반 드롭아웃 레이어(Attention-based Dropout Layer, ADL)를 제안합니다. 제안된 방법은 두 가지 핵심 구성 요소로 이루어져 있습니다: 1) 객체의 전체 범위를 포착하기 위해 모델에서 가장 구별되는 부분을 숨기는 것, 그리고 2) 모델의 인식 능력을 향상시키기 위해 정보가 많은 영역을 강조하는 것입니다. 광범위한 실험을 통해 제안된 방법이 WSOL의 정확도를 개선하는 데 효과적임을 입증하였으며, CUB-200-2011 데이터셋에서 새로운 최고 수준의 위치 추정 정확도를 달성하였습니다. 또한, 제안된 방법이 기존 기술보다 매개변수와 계산 부하 측면에서 훨씬 효율적임을 보여주었습니다.