2달 전

객체 랜드마크의 인수 분해된 공간 임베딩을 통한 비지도 학습

James Thewlis; Hakan Bilen; Andrea Vedaldi
객체 랜드마크의 인수 분해된 공간 임베딩을 통한 비지도 학습
초록

물체 카테고리의 구조를 자동으로 학습하는 것은 컴퓨터 비전 분야에서 중요한 미해결 문제입니다. 본 논문에서는 물체 카테고리 내에서 랜드마크를 발견하고 학습할 수 있는 새로운 비지도 학습 접근법을 제안합니다. 이 접근법은 시점 변화나 물체 변형 등에 의해 유발되는 이미지 변형을 인자분해(factorizing)하는 것으로, 이러한 시각적 효과와 일관되게 랜드마크를 감지하는 깊은 신경망(deep neural network)을 학습하는 기반 위에 설립되었습니다. 또한, 우리는 이 방법이 명시적으로 이러한 요구사항을 부과하지 않아도 같은 카테고리 내의 서로 다른 물체 인스턴스 간에 의미 있는 대응관계를 설정함을 보여줍니다. 우리는 다양한 종류의 물체, 자연물과 인공물에 대해 이 방법을 질적으로 평가하였습니다. 또한, 우리의 비지도 랜드마크가 얼굴 벤치마크 데이터셋에서 수작업으로 주석화된 랜드마크를 매우 정확하게 예측하며, 이를 높은 정확도로 회귀(regress)할 수 있음을 보여주었습니다.