14일 전

퍼뮤파드 아다인: 이미지 분류에서 전역 통계에 대한 편향 감소

Oren Nuriel, Sagie Benaim, Lior Wolf
퍼뮤파드 아다인: 이미지 분류에서 전역 통계에 대한 편향 감소
초록

최근 연구에서는 합성곱 신경망 분류기가 모양 정보보다 질감 정보에 과도하게 의존한다는 것이 밝혀졌다. 본 연구에서는 모양 및 국부적 이미지 특징과 전반적인 이미지 통계량 사이에 유사하지만 다른 구분을 제안한다. 제안하는 방법은 '퍼뮤파드 적응형 인스턴스 정규화(Permuted Adaptive Instance Normalization, pAdaIN)'로, 이미지 분류기의 은닉층에서 전반적인 이미지 통계량의 표현을 줄이는 데 목적이 있다. pAdaIN은 주어진 배치 내 샘플들을 무작위로 재배열하는 랜덤 순열 $π$를 샘플링한다. 이후 각 샘플 $i$의 활성화 값과 그에 대응하는 샘플 $π(i)$의 활성화 값 사이에 적응형 인스턴스 정규화(Adaptive Instance Normalization, AdaIN)를 적용함으로써 배치 내 샘플들 간의 통계량을 교환한다. 전반적인 이미지 통계량이 왜곡됨에 따라 이 교환 과정은 모양이나 질감과 같은 특징에 의존하도록 네트워크를 유도한다. 무작위 순열을 확률 $p$로 선택하고, 그 외의 경우 항등 순열(identity permutation)을 사용함으로써 이 효과의 강도를 조절할 수 있다.적절한 $p$ 값을 사전에 고정하여 모든 실험에 일관되게 사용하면(시험 데이터를 고려하지 않고 선택), 제안한 방법은 다양한 설정에서 기존의 베이스라인을 항상 우수하게 성능을 발휘한다. 이미지 분류 문제에서는 여러 아키텍처를 사용하여 CIFAR100 및 ImageNet에서 성능 향상을 보였다. 강건성(robustness) 설정에서는 여러 아키텍처에 대해 ImageNet-C 및 CIFAR100-C에서 성능이 향상되었다. 도메인 적응(domain adaptation) 및 도메인 일반화(domain generalization) 설정에서는 GTAV에서 Cityscapes로의 전이 학습(task)과 PACS 벤치마크에서 최신 기술 수준(state-of-the-art)의 성능을 달성하였다.

퍼뮤파드 아다인: 이미지 분류에서 전역 통계에 대한 편향 감소 | 최신 연구 논문 | HyperAI초신경