LANDMARKS의 DESCRIPTOR VECTOR 교환을 통한 비지도 학습

무작위 이미지 변환에 대한 등변성(equivariance)은 수동 감독 없이 객체 카테고리의 랜드마크(예: 얼굴에서 눈과 코)를 학습하는 효과적인 방법입니다. 그러나 이 방법은 동일한 객체의 다른 인스턴스 간의 변화와 학습된 랜드마크가 명시적으로 일관되다는 것을 보장하지 않습니다(예: 다른 얼굴 식별). 본 논문에서는 등변성 접근법에 대한 새로운 관점을 제시합니다. 밀도 높은 랜드마크 검출기가 카테고리 내 변형에 대한 불변성을 갖춘 국부 이미지 설명자(descriptor)로 해석될 수 있다는 점을 주목하였습니다. 이를 바탕으로 표준 등변 손실(equivariant loss)에서 이러한 불변성을 강제하는 직접적인 방법을 제안합니다. 이를 위해 서로 다른 객체 인스턴스의 이미지 간에 설명자 벡터(descriptor vector)를 교환한 후 기하학적으로 일치시키는 과정을 거칩니다. 이렇게 하면 고려되는 특정 객체 식별과 상관없이 같은 벡터가 작동해야 합니다. 우리는 이 접근법을 사용하여 국부 설명자와 밀도 높은 �랜드마크로 동시에 해석될 수 있는 벡터를 학습하였습니다. 이를 통해 양쪽의 장점을 결합할 수 있습니다. 표준 벤치마크에서 수행한 실험 결과, 이 접근법이 감독 없이 랜드마크를 학습하는 기존 방법들 중 최신 연구 성과(state-of-the-art performance)와 맞먹거나, 일부 경우에는 그보다 우수한 성능을 보임을 확인할 수 있었습니다. 코드는 www.robots.ox.ac.uk/~vgg/research/DVE/에서 제공됩니다.