17일 전
예술 이미지 내 객체 탐지 개선을 위한 스타일 전이 단독 활용
David Kadish, Sebastian Risi, Anders Sundnes Løvlie

초록
최근 딥러닝 신경망을 활용한 객체 탐지 기술은 상당한 발전을 이뤘지만, 그 신경망은 그림이나 드로잉과 같은 예술 이미지 내 객체를 식별하는 데 여전히 어려움을 겪고 있다. 이 문제는 ‘크로스 디피션 문제(Cross Depiction Problem)’로 알려져 있으며, 신경망이 객체의 형태보다 질감을 우선적으로 인식하려는 경향에서 비롯된다. 본 논문에서는 예술 이미지 내 객체, 특히 사람을 탐지하고 위치를 파악할 수 있도록 신경망을 훈련시키는 과정을 제안하고 평가한다. 우리는 COCO 데이터셋의 이미지를 AdaIn 스타일 전이 기법을 활용해 변형함으로써 대규모의 훈련 및 검증용 데이터셋을 생성한다. 이 데이터셋을 사용해 Faster R-CNN 객체 탐지 네트워크를 미세 조정(fine-tune)한 후, 기존의 People-Art 테스트 데이터셋을 이용해 성능을 검증한다. 그 결과, 기존 최고 성능(state-of-the-art)을 크게 초월하는 성과를 달성하였으며, 예술 이미지를 처리할 수 있도록 신경망을 훈련시키기 위한 새로운 데이터셋 구축 방향성을 제시하게 되었다.