17일 전
조각 조각의 점진적 다중 과정 훈련을 통한 미세한 시각 분류
Ruoyi Du, Dongliang Chang, Ayan Kumar Bhunia, Jiyang Xie, Zhanyu Ma, Yi-Zhe Song, Jun Guo

초록
미세한 시각 분류(Fine-grained visual classification, FGVC)는 클래스 내 객체 간 본질적으로 미세한 차이를 가지기 때문에 전통적인 분류 작업보다 훨씬 도전적이다. 최근 연구들은 주로 가장 구분력 있는 부분, 보완적인 부분, 다양한 미세도의 부분을 어떻게 탐지할 것인지에 초점을 맞추고 있다. 그러나 어떤 미세도가 가장 구분력 있는지, 그리고 다양한 미세도 간 정보를 어떻게 융합할 것인지에 대한 연구는 상대적으로 부족한 실정이다. 본 연구에서는 이러한 문제를 해결하기 위해 새로운 프레임워크를 제안한다. 구체적으로 다음과 같은 두 가지 기법을 제안한다: (i) 다양한 미세도에서 추출한 특징을 효과적으로 융합하는 점진적 훈련 전략, (ii) 특정 미세도에서의 특징을 학습하도록 네트워크를 유도하는 무작위 조각 조립( random jigsaw patch) 생성기. 제안한 방법은 여러 표준 FGVC 벤치마크 데이터셋에서 최신 기술 수준의 성능을 달성하였으며, 기존 방법들을 지속적으로 능가하거나 경쟁 가능한 결과를 제공하였다. 코드는 https://github.com/PRIS-CV/PMG-Progressive-Multi-Granularity-Training 에서 공개될 예정이다.