2달 전
비지도 객체 발견 및 공동 위치 결정을 위한 깊은 설명자 변환
Xiu-Shen Wei; Chen-Lin Zhang; Jianxin Wu; Chunhua Shen; Zhi-Hua Zhou

초록
컴퓨터 비전과 기계 학습 응용 프로그램의 급속한 확장에 따라 재사용 가능한 모델 설계가 바람직해지고 있습니다. 본 논문에서는 사전 훈련된 딥 컨볼루션 모델의 재사용성에 초점을 맞추고 있습니다. 특히, 사전 훈련된 모델을 특징 추출기로만 취급하는 것과 달리, 컨볼루션 계층 아래에 숨겨진 더 많은 가치를 밝히는데 주력합니다. 즉, 컨볼루션 활성화는 이미지 공통 객체 위치 추정 문제에서 공통 객체를 감지하는 검출기 역할을 할 수 있다는 것입니다. 우리는 이를 평가하고 범주 일관적인 영역을 얻어, 라벨이 부여되지 않은 이미지 집합에서 공통 객체를 정확하게 위치시키는 간단하면서도 효과적인 방법인 딥 디스크립터 변환(Deep Descriptor Transforming, DDT)을 제안합니다. 경험적 연구는 제안된 DDT 방법의 유효성을 입증합니다. 벤치마크 이미지 공통 객체 위치 추정 데이터셋에서 DDT는 기존 최신 방법들보다 크게 우수한 성능을 보입니다. 또한, DDT는 미처 본 적 없는 범주에 대한 좋은 일반화 능력과 노이즈 데이터 처리에 대한 강건성을 보여줍니다. 이 외에도, DDT는 웹 이미지를 수집하여 이미지 인식 및 객체 검출의 성능을 개선하기 위한 유효한 외부 데이터 소스로 활용될 수 있습니다.