
초록
약한 감독 하의 개체 탐지(Weakly supervised object localization, WSOL)는 이미지 수준의 레이블만을 사용하여 개체의 위치를 탐지하는 것을 목표로 한다. 기존의 방법들은 일반적으로 특징 맵과 분류 가중치를 활용하여 이미지 수준의 레이블을 간접적으로 이용해 개체를 탐지하려 했다. 본 논문에서는 약한 감독 하의 개체 탐지가 두 가지 부분으로 나누어져야 한다는 점을 제시한다. 즉, 클래스에 종속되지 않는 개체 탐지와 개체 분류이다. 클래스에 종속되지 않는 개체 탐지의 경우, 클래스 레이블 없이 클래스에 종속되지 않는 방법을 사용하여 노이즈가 포함된 가상의 레이블(퍼지 피소 레이블)을 생성한 후, 이를 바탕으로 경계 상자 회귀를 수행해야 한다. 이를 위해 우리는 새로운 WSOL 해결 방안으로 가상 감독 개체 탐지(Pseudo supervised object localization, PSOL) 방법을 제안한다. 제안하는 PSOL 모델은 미세 조정 없이 다양한 데이터셋 간에 뛰어난 전이 성능을 보인다. 생성된 가상 경계 상자를 활용하여 ImageNet에서는 58.00%의 탐지 정확도, CUB-200에서는 74.97%의 탐지 정확도를 달성하였으며, 이는 기존 모델들에 비해 상당한 성능 우위를 보였다.