2달 전
생성적 적대 네트워크 및 순위 네트워크를 이용한 약간 감독된 객체 발견
Ali Diba; Vivek Sharma; Rainer Stiefelhagen; Luc Van Gool

초록
최근 깊은 생성적 적대 네트워크(Deep Generative Adversarial Networks, GAN)는 이미지 편집, 고해상도 이미지 합성, 비디오 생성 등 다양한 컴퓨터 비전 응용 분야에서 유망한 결과를 보여주고 있습니다. 이러한 네트워크와 해당 학습 방식은 다양한 시각 공간 매핑을 처리할 수 있습니다. 우리는 세 가지 경우에 대해 여러 객체 인스턴스를 발견하기 위해 새로운 훈련 방법과 학습 목표를 제안합니다: 1) 복잡한 장면 내에서 특정 객체의 사진을 합성하는 것; 2) 약간 감독된 객체 검출을 위한 이미지에서 다른 카테고리를 위치 지정하는 것; 3) 객체 검출 파이프라인에서 객체 발견을 개선하는 것. 우리 방법의 중요한 장점은 하나의 이미지 내에서 여러 객체를 구분하기 위한 새로운 깊은 유사성 메트릭을 학습한다는 것입니다. 우리는 네트워크가 객체를 포함하는 이미지의 일부를 생성하는 인코더-디코더로 작동하거나, 감독 및 약간 감독된 방식에서 객체 검출을 위한 이미지를 표현하기 위해 수정된 깊은 CNN으로 작동할 수 있음을 보여줍니다. 우리의 순위 GAN(Ranking GAN)은 객체 특异性 패턴을 찾아내기 위한 새로운 방법을 제공합니다. 우리는 다양한 시나리오에 대한 실험을 수행하였으며, MS-COCO와 PASCAL VOC 데이터셋을 사용하여 객체 합성과 약간 감독된 객체 검출 및 분류 성능을 입증하였습니다.