2달 전

비지도 부분 기반 객체 형태와 외관의 분리

Dominik Lorenz; Leonard Bereska; Timo Milbich; Björn Ommer
비지도 부분 기반 객체 형태와 외관의 분리
초록

대규모 클래스 내 변동은 여러 객체 특성의 변화로 인해 발생합니다. 그러나 이미지는 외관이나 형태와 같은 다양한 변수 요소들의 중첩만을 보여줍니다. 따라서 이러한 다른 특성을 분리하고 표현하는 것은 특히 비지도 학습의 경우에 큰 도전이 됩니다. 또한, 대규모 객체 아르티큘레이션(articulation)은 유연한 부품 기반 모델을 요구합니다. 우리는 카테고리의 모든 인스턴스에서 일관되게 부품을 학습하여 외관과 형태를 분리하는 비지도 접근법을 제시합니다. 우리의 객체 표현 학습 모델은 합성 변환된 이미지 간의 불변성(invariance) 및 동등성(equivariance) 제약 조건을 동시에 활용하여 훈련됩니다. 어떠한 부품 주석이나 객체 클래스에 대한 사전 정보도 필요하지 않으므로, 이 접근법은 임의의 클래스에 적용할 수 있습니다. 우리는 포즈 예측, 분리된 이미지 생성, 비디오-비디오 변환 등 다양한 객체 카테고리와 다양한 작업에서 우리의 접근법을 평가하였습니다. 이 접근법은 비지도 키포인트 예측에서 최신 연구 결과를 능가하며, 형태와 외관 전송 작업에서도 지도 접근법과 비교해 우수한 성능을 보입니다.

비지도 부분 기반 객체 형태와 외관의 분리 | 최신 연구 논문 | HyperAI초신경