
초록
최근, 약간의 감독을 받는 객체 검출이 객체 인식에서 매우 중요한 역할을 하고 있습니다. 딥러닝 기반으로 약간의 감독을 받는 검출기들은 많은 유망한 결과를 달성하였습니다. 그러나 완전히 감독된 검출과 비교할 때, 딥 네트워크 기반의 검출기를 약간의 감독 방식으로 훈련시키는 것은 더욱 어려운 과제입니다. 본 연구에서는 약간의 감독을 받는 검출을 다중 인스턴스 학습(Multiple Instance Learning, MIL) 문제로 정식화하였습니다. 여기서 인스턴스 분류기(객체 검출기)들이 네트워크 내부에 숨겨진 노드로 배치됩니다. 우리는 새로운 온라인 인스턴스 분류기 개선 알고리즘을 제안하여 MIL과 인스턴스 분류기 개선 절차를 단일 딥 네트워크로 통합하고, 오직 이미지 레벨의 지도만으로, 즉 객체 위치 정보 없이 네트워크를 엔드-투-엔드로 훈련시킵니다. 구체적으로, 약한 지도로부터 추론된 인스턴스 라벨은 공간적으로 겹치는 인스턴스들에게 전파되어 온라인으로 인스턴스 분류기를 개선합니다. 이 반복적인 인스턴스 분류기 개선 절차는 각 스트림이 그 다음 스트림을 지도하는 여러 스트림을 사용하여 딥 네트워크에서 구현되었습니다. PASCAL VOC 2007 및 2012 벤치마크에서 도전적인 약간의 감독을 받는 객체 검출 실험을 수행하였으며, VOC 2007에서 47%의 평균 정밀도(mAP)를 얻어 이전 최신 기술보다 크게 우수한 성능을 보였습니다.