시각적 주의를 고려한 데이터 증강을 위한 도메인 적응형 전이 학습: 미세한 시각 분류를 위한 연구

미세한 시각 분류(Fine-Grained Visual Categorization, FGVC)는 컴퓨터 비전 분야에서 도전적인 주제로, 클래스 내 차이가 크고 클래스 간 차이가 미세한 특징을 지닌 문제이다. 본 논문에서는 신경망 모델에 시각적 주의 메커니즘을 활용한 데이터 증강 기술을 통해 추가 데이터를 입력하는 약한 지도 학습 방식으로 이 문제를 해결한다. 기반 네트워크 모델에 대해 미세 조정(fine-tuning)을 통한 도메인 적응형 지식 전이를 수행한다. 본 연구는 여섯 가지 도전적이고 널리 사용되는 FGVC 데이터셋에서 실험을 수행하였으며, 대규모 데이터셋으로 사전 학습된 딥러닝 모델 InceptionV3에서 추출한 특징을 활용한 시각적 주의 기반 데이터 증강 기법을 적용함으로써 정확도 측면에서 경쟁력 있는 개선 효과를 보였다. 제안한 방법은 여러 FGVC 데이터셋에서 기존 대비 우수한 성능을 보였으며, 다른 데이터셋에서도 경쟁력 있는 결과를 도출하였다. 실험 결과는 대규모 데이터셋에서의 전이 학습(transfer learning)이 시각적 주의 기반 데이터 증강과 결합할 경우 효과적으로 활용될 수 있음을 보여주며, 여러 FGVC 데이터셋에서 최신 기술(SOTA, State-of-the-art) 수준의 성능을 달성할 수 있음을 확인하였다. 본 연구에서는 실험 결과에 대한 포괄적인 분석을 제시하였으며, 특히 도전적인 CUB200-2011 새, Flowers-102, FGVC-Aircraft 데이터셋을 포함한 다양한 미세 분류 데이터셋에서 최신 기술 수준의 성능을 달성하였다.