11일 전
심층 특징을 활용한 다중 예제 학습을 통한 극한의 도메인 차이가 존재하는 약한 감독 하의 객체 탐지
Nicolas Gonthier, Saïd Ladjal, Yann Gousseau

초록
최근 몇 년간 이미지 레벨의 레이블만을 사용하는 약한 감독 객체 탐지(WSOD)에 대한 관심이 점차 증가하고 있다. 일반적으로 이러한 작업은 자연 이미지에 특화된 도메인 전용 솔루션으로 접근되지만, 본 연구에서는 사전 훈련된 심층 특징에 간단한 다중 예제(Multiple Instance) 접근법을 적용함으로써 비사진 데이터셋(예: 새로운 클래스를 포함할 수 있음)에서도 뛰어난 성능을 달성함을 보여준다. 제안하는 방법은 어떤 미세 조정(fine-tuning)이나 다중 도메인 학습도 포함하지 않기 때문에 효율적이며, 임의의 데이터셋과 클래스에 적용 가능하다는 장점이 있다. 우리는 제안된 접근법의 다양한 변형을 탐구하였으며, 일부는 다층 퍼셉트론 및 다면체 분류기(multilayer perceptron 및 polyhedral classifiers)를 포함한다. 단순한 구조임에도 불구하고, 본 방법은 인상화(People-Art, IconArt), 수채화, 클리퍼트, 만화 등 공개된 다양한 데이터셋에서 경쟁력 있는 성능을 보이며, 미리 보지 못한 시각적 카테고리도 빠르게 학습할 수 있게 한다.