18일 전

배치 혼란 정규화를 이용한 세부 시각 분류

{Tyng-Luh Liu, Ming-Sui Lee, Ding-Jie Chen, Cheng-Yao Hong, Yen-Chi Hsu, Davi Geiger}
초록

우리는 미세한 시각 분류(Fine-Grained Visual Classification, FGVC) 문제를 해결하기 위해 제안된 배치 혼란 정규화(Batch Confusion Norm, BCN) 기반의 정규화 개념을 소개한다. FGVC 문제는 특히 클래스 간 유사성과 클래스 내 변동성이 뚜렷하게 나타나는 두 가지 흥미로운 특성을 지니고 있어, 효과적인 FGVC 분류기를 학습시키는 데 도전적인 과제를 제기한다. 쌍별 혼란 에너지(pairwise confusion energy)를 정규화 메커니즘으로 활용한 아이디어에 영감을 받아, 각 학습 배치에 대해 클래스 예측 혼란을 유도함으로써 FGVC 학습을 향상시키는 BCN 기술을 개발하였다. 이를 통해 미세한 이미지 특징을 탐색함에 따라 발생할 수 있는 과적합(overfitting)을 완화할 수 있다. 또한 본 연구에서는 Atrous Spatial Pyramid Pooling(ASPP)을 통합하여 구분 능력 있는 특징과 적절한 주의(attention)를 추출할 수 있도록 주의 게이트(attention gated) CNN 모델을 기반으로 한 구현 방식을 제안한다. 제안한 방법의 유용성을 입증하기 위해 여러 벤치마크 FGVC 데이터셋에서 최신 기준(SOTA) 성능을 기록하였으며, 포괄적인 추상화(ablation) 비교를 통해 각 구성 요소의 기여도를 분석하였다.

배치 혼란 정규화를 이용한 세부 시각 분류 | 최신 연구 논문 | HyperAI초신경