2달 전
세부 시각 분류를 위한 쌍별 혼동
Abhimanyu Dubey; Otkrist Gupta; Pei Guo; Ramesh Raskar; Ryan Farrell; Nikhil Naik

초록
세부 시각 분류(Fine-Grained Visual Classification, FGVC) 데이터셋은 작은 샘플 크기와 함께 클래스 내의 큰 변동성 및 클래스 간 유사성을 포함하고 있습니다. 이전 연구에서는 위치 추정(localization) 및 분할(segmentation) 기술을 사용하여 클래스 내 변동성을 해결하였으나, 클래스 간 유사성도 특징 학습에 영향을 미치고 분류 성능을 저하시킬 수 있습니다. 본 연구에서는 이러한 문제를 FGVC 작업에서의 엔드투엔드(end-to-end) 신경망 훈련을 위한 새로운 최적화 절차를 통해 해결합니다. 이 절차인 쌍별 혼동(Pairwise Confusion, PC)은 활성화 과정에서 고의적으로 혼동을 도입하여 과적합(overfitting)을 줄입니다. PC 정규화(regularization)를 사용함으로써, 우리는 가장 널리 사용되는 6개의 FGVC 데이터셋에서 최고 수준의 성능을 달성하였으며, 개선된 위치 추정 능력을 입증하였습니다. PC는 구현이 쉽고, 훈련 중 과도한 하이퍼파라미터 조정이 필요하지 않으며, 테스트 시간 동안 상당한 부하를 추가하지 않습니다.