
초록
약한 감독 객체 탐지 네트워크는 개체 수준의 카테고리 레이블이 없기 때문에 객체의 정확한 위치를 예측하는 것이 어렵다. 기존 대부분의 방법은 이 문제를 해결하기 위해 두 단계 학습 절차를 사용한다. 즉, 다중 인스턴스 학습(MIL) 기반 탐지기로 초기 탐지 후, 경계상자 회귀를 수행하는 완전 감독 학습 탐지기를 적용하는 방식이다. 본 연구에서 우리는 이러한 절차가 일부 객체 카테고리에 대해 국소 최소값에 빠질 수 있음을 관찰하였다. 이를 해결하기 위해, 본 논문에서는 두 단계를 종단 간(end-to-end)으로 공동 학습하는 방법을 제안한다. 구체적으로, 동일한 백본을 공유하는 다중 인스턴스 학습 브랜치와 경계상자 회귀 브랜치를 갖는 단일 네트워크를 설계하였다. 동시에, 분류 손실을 활용한 안내 주의 모듈(guided attention module)을 백본에 추가하여 특징 내 은닉된 위치 정보를 효과적으로 추출한다. 공개 데이터셋에서의 실험 결과, 제안하는 방법이 최신 기술 수준의 성능을 달성함을 확인하였다.