세부 인식: 유사한 클래스 간 미세한 차이 고려

세부적인 인식 작업( fine-grained recognition task )을 수행하기 위한 주요 조건은 하위 클래스들 간의 차이를 만들어내는 미세한 구분 가능한 특징에 주목하는 것이다. 기존의 방법들은 이 요구사항을 암묵적으로 다루며, 어떤 하위 클래스가 다른 클래스와 다른지를 판단하는 것은 데이터 기반 파이프라인에 맡긴다. 이로 인해 두 가지 주요한 한계가 발생한다. 첫째, 네트워크는 클래스 간 가장 두드러진 차이점에만 집중하게 되어 더 미묘한 클래스 간 차이를 간과하게 된다. 둘째, 주어진 샘플이 어떤 부정 클래스로 잘못 분류될 가능성은 동일하게 간주되지만, 실제로는 가장 유사한 클래스들 사이에서만 혼동이 자주 발생한다. 본 연구에서는 네트워크가 밀접하게 관련된 클래스들 사이의 미세한 차이를 명시적으로 탐색하도록 유도하는 새로운 접근법을 제안한다. 이를 위해 기존의 엔드투엔드 딥러닝 파이프라인에 쉽게 통합할 수 있는 두 가지 핵심 기법을 도입한다. 한편으로는, 입력에 대해 가장 두드러진 특징을 마스킹하는 다변화 블록( diversification block )을 도입하여, 네트워크가 정확한 분류를 위해 더 미세한 단서를 활용하도록 강제한다. 동시에, 각 샘플에 대해 혼동이 발생하기 쉬운 클래스들에만 초점을 맞춘 그래디언트 부스팅 손실 함수( gradient-boosting loss function )를 제안한다. 이는 손실 표면에서 이러한 모호성을 해결하려는 방향으로 신속하게 진행되도록 한다. 이러한 두 블록 간의 상호작용은 네트워크가 보다 효과적인 특징 표현을 학습하도록 돕는다. 제안한 방법은 다섯 가지 도전적인 데이터셋에서 종합적인 실험을 수행하여 검증되었으며, 동일한 실험 설정 하에서 기존의 방법들보다 모든 데이터셋에서 우수한 성능을 보였다.