
미세 차량 인식(Fine-grained vehicle recognition, FGVR)은 지능형 교통 시스템에서 필수적인 기초 기술이지만, 그 고유의 클래스 내 변동성 때문에 매우 어렵습니다. 이전의 대부분 FGVR 연구는 촬영 각도, 위치 등으로 인한 클래스 내 변동성에만 초점을 맞추었으며, 이미지 노이즈로 인한 클래스 내 변동성에는 거의 주목하지 않았습니다. 본 논문에서는 FGVR에서 이미지 노이즈로 인한 클래스 내 변동성을 해결하기 위해 점진적 다중 작업 항노이즈 학습(Progressive Multi-Task Anti-Noise Learning, PMAL) 프레임워크와 점진적 다중 작업 디스틸링(Progressive Multi-Task Distilling, PMD) 프레임워크를 제안합니다. PMAL 프레임워크는 이미지 인식 과정에서 이미지 노이즈 제거를 추가 작업으로 취급하고, 모델을 단계적으로 노이즈 불변성을 학습하도록 강제함으로써 높은 인식 정확도를 달성합니다. PMD 프레임워크는 PMAL로 훈련된 모델의 지식을 원래 백본 네트워크(original backbone network)로 전송하여, 원래 백본 네트워크보다 추가적인 부하 없이 PMAL로 훈련된 모델과 비슷한 인식 정확도를 가진 모델을 생성합니다. 두 프레임워크를 결합하여 우리는 스탠퍼드 카(Stanford Cars)와 컴프카(CompCars)라는 두 개의 널리 사용되는 표준 FGVR 데이터셋뿐만 아니라 베이징 공과대학교(Beijing Institute of Technology, BIT)-차량(Vehicle), 차량 유형 이미지 데이터 2(Vehicle Type Image Data 2, VTID2), 차량 이미지 데이터셋 for 제조사 및 모델 인식(Vehicle Images Dataset for Make Model Recognition, VIDMMR)이라는 세 개의 추가적인 감시 이미지 기반 차량 유형 분류 데이터셋에서도 원래 백본 네트워크보다 추가적인 부하 없이 이전 최신 방법론(state-of-the-art methods)을 크게 초월하는 인식 정확도를 얻었습니다. 소스 코드는 https://github.com/Dichao-Liu/Anti-noise_FGVR에서 확인할 수 있습니다.