
초록
연구에 따르면, 객체 인식을 위한 합성곱 신경망(Convolutional Neural Networks)은 텍스처 패치의 저수준 통계에 대한 학습 편향으로 인해 표현 방식의 변화에 취약하다. 최근 연구들은 특정 표현 스타일에 과적합되는 것을 완화하기 위해 훈련 예시에 스타일 전이(Style Transfer)를 적용함으로써 강건성을 향상시키는 데 초점을 맞추고 있다. 이러한 새로운 접근법은 성능 향상을 가져오지만, 실제 예술 작품에서 나타나는 객체 형태의 기하학적 변형을 무시한다. 예술가들은 예술적 효과를 위해 객체를 왜곡하거나 왜곡시키는 경우가 많기 때문이다. 이러한 관찰에 착안하여, 본 연구에서는 훈련 데이터의 텍스처와 기하학적 다양성을 동시에 증가시킴으로써 편향을 줄이는 방법을 제안한다. 즉, 예술가들이 사용하는 형태 변화를 포함한 시각적 객체 클래스를 확장하는 효과를 얻는다. 구체적으로, 주어진 각 객체 클래스를 커버하는 왜곡(warp) 분포를 학습한다. 다양한 스타일 분포를 기반으로 한 텍스처 증강과 함께, 실험을 통해 제안하는 방법이 여러 교차 도메인 벤치마크에서 성능 향상을 보임을 입증하였다.