
초록
대규모 이미지 레벨 분류 작업에 사전 훈련된 딥 컨볼루션 신경망의 성능을 활용하여 객체 검출의 약한 지도 학습 문제를 다루는 것이 여전히 만족스러운 해결책이 없는 중요한 문제입니다. 본 논문에서는 이러한 문제를 해결하기 위해 대규모 이미지 레벨 분류 작업에 사전 훈련된 딥 컨볼루션 신경망을 수정하여 이미지 영역 수준에서 작동하도록 하는 약한 지도 딥 검출 아키텍처를 제안합니다. 이 아키텍처는 동시에 영역 선택과 분류를 수행하며, 이미지 분류기로 훈련됨으로써 PASCAL VOC 데이터에서 대체 가능한 다른 약한 지도 검출 시스템보다 우수한 객체 검출기를 내재적으로 학습합니다. 이 모델은 간단하고 우아한 엔드투엔드 아키텍처로, 이미지 레벨 분류 작업에서도 표준 데이터 증강 및 미세 조정 기술을 능가합니다.