간단한 에피소딕 선형 프로브가 와일드 환경에서의 시각 인식 성능을 향상시킨다

시각 인식 분야에서 네트워크의 일반화 능력과 특징 구분 능력을 이해하는 것은 여전히 열린 연구 과제이다. 다양한 연구들이 특징 표현의 품질을 평가하기 위해 수행되어 왔다. 그 중 하나의 간단한 전략은 얻어진 특징 하에서 클래스 정확도를 정량적으로 평가하기 위해 선형 탐지기(classifier)를 활용하는 것이다. 전형적인 선형 탐지기는 주로 추론 단계에서 대리 모델(Proxy)로 사용되지만, 학습 과정에서 이러한 탐지기가 특징 표현이 선형 분류에 적합한지를 측정하는 데 있어 그 효과가 크게 간과되어 왔다. 본 논문에서는 학습 과정에서 시각적 표현의 일반화 능력을 온라인 방식으로 반영할 수 있는 이벤트 기반 선형 탐지기(Episodic Linear Probing, ELP)를 제안한다. ELP는 네트워크에서 분리된 특징을 사용하여 학습되며, 주기적으로 재초기화된다. 이는 학습 중에 시각적 표현의 구분 능력을 효과적으로 나타낸다. 또한, ELP 탐지기와 메인 탐지기 간의 확률 분포 간 거리를 반영하기 위해 ELP-적합 정규화 항(ELP-Suitable Regularization, ELP-SR)을 도입한다. ELP-SR은 각 샘플에 대해 재스케일링 요소를 활용하여 손실 함수를 적응적으로 조절함으로써, 특징이 구분력 있고 일반화 가능한 방향으로 학습되도록 유도한다. 실세계 시각 인식 과제 세 가지—세부적 시각 분류, 긴 꼬리 분포 시각 인식, 일반 물체 인식—에서 뚜렷한 성능 향상이 관측되었으며, 본 방법이 네트워크의 일반화 및 특징 구분 능력 향상에 효과적임을 입증한다.