19일 전

고온도 개선 및 배경 억제를 통한 세부 시각 분류

Po-Yung Chou, Yu-Yung Kao, Cheng-Hung Lin
고온도 개선 및 배경 억제를 통한 세부 시각 분류
초록

세부 시각 분류(Fine-grained visual classification)는 카테고리 간의 높은 유사성과 단일 카테고리 내 데이터 간의 큰 차이로 인해 도전적인 과제이다. 이러한 문제를 해결하기 위해 기존의 전략들은 카테고리 간의 미세한 차이를 정확히 위치화하고, 이를 통해 구분 능력을 높이는 데 초점을 맞추어 왔다. 그러나 배경 정보 역시 모델이 어떤 특징이 분류에 불필요하거나 오히려 해로울 수 있는지를 판단하는 데 중요한 역할을 하며, 미세한 특징에 과도하게 의존하는 모델은 전반적인 특징과 맥락 정보를 간과할 수 있다. 본 논문에서는 이러한 문제를 해결하기 위해, 구분 가능한 특징을 효과적으로 추출하고 배경 노이즈를 억제하는 두 가지 모듈을 갖춘 새로운 네트워크인 "High-temperature Refinement and Background Suppression"(HERBS)을 제안한다. HERBS는 고온도 정제 모듈(high-temperature refinement module)과 배경 억제 모듈(background suppression module)로 구성된다. 고온도 정제 모듈은 다양한 스케일에서 특징 맵을 정제함으로써 모델이 적절한 특징 스케일을 학습하도록 돕고, 다양한 특징의 학습을 향상시킨다. 반면, 배경 억제 모듈은 분류 신뢰도 점수를 활용하여 특징 맵을 전경과 배경으로 분할하고, 낮은 신뢰도 영역의 특징 값을 억제하면서 동시에 구분 가능한 특징을 강화한다. 실험 결과, 제안한 HERBS는 다양한 스케일의 특징을 효과적으로 융합하고, 배경 노이즈를 억제하며 적절한 스케일에서 구분 가능한 특징을 추출함으로써 세부 시각 분류의 성능을 향상시킨다. 제안된 방법은 CUB-200-2011 및 NABirds 벤치마크에서 최신 기술(SOTA) 성능을 달성하여, 두 데이터셋 모두에서 93% 이상의 정확도를 기록하였다. 따라서 HERBS는 세부 시각 분류 작업의 성능 향상에 있어 매우 유망한 해결책을 제시한다. 코드: https://github.com/chou141253/FGVC-HERBS