
초록
분류 네트워크는 클래스 활성화 맵(Class Activation Maps, CAMs)를 통해 이미지 내 객체의 위치 추정 및 세분화에 활용될 수 있다. 그러나 픽셀 수준의 레이블 없이 분류 네트워크를 사용할 경우, (1) 주로 구분력 있는 영역에 집중하게 되며, (2) 예측 경계가 명확하지 않은 흐릿한 CAM을 생성한다는 문제가 있다. 본 연구에서는 이러한 두 가지 문제를 해결하기 위해 CAM 학습을 개선하기 위한 두 가지 기여를 제안한다. 첫째, CAM이 유도하는 클래스별 확률 질량 함수를 기반으로 중요도 샘플링(importance sampling)을 도입하여 확률적인 이미지 수준의 클래스 예측을 생성한다. 이로 인해 객체의 더 넓은 영역에 걸쳐 CAM이 활성화되며, 예측 영역이 더 포괄적으로 확장된다. 둘째, 이미지 내 에지 정보와 예측 경계를 일치시키는 것을 목표로 하는 특징 유사성 손실 항목(feature similarity loss term)을 제안한다. 세 번째로, PASCAL VOC 2012 벤치마크 데이터셋에서 실험을 수행하여, 제안된 방법이 경계 정확도 측면에서 기존의 최첨단 기법과 비교해 유의미한 성능 향상을 보임을 입증하였다. 또한 영역 유사성 측면에서는 현재 최고 수준의 기법들과 유사한 성능을 달성하였다.