8일 전

노이즈 있는 레이블을 위한 이웃 일관성 학습

Ahmet Iscen, Jack Valmadre, Anurag Arnab, Cordelia Schmid
노이즈 있는 레이블을 위한 이웃 일관성 학습
초록

최근 딥러닝 분야의 발전은 고용량 모델을 훈련시키기 위해 대규모의 레이블이 부여된 데이터셋에 의존해 왔다. 그러나 시간과 비용 측면에서 대규모 데이터셋을 수집하는 과정은 종종 레이블 노이즈를 초래한다. 본 연구에서는 특성 공간 내 훈련 예제 간의 유사성을 활용하여, 각 예제의 예측이 그에 가장 가까운 이웃들과 유사하도록 유도하는 노이즈 레이블 학습 방법을 제안한다. 기존의 다수 모델을 사용하거나 별도의 단계를 거치는 훈련 알고리즘들과 달리, 본 방법은 간단한 추가 정규화 항(Regularization Term) 형태로 구현된다. 이는 전통적인 비유도적(label propagation) 알고리즘의 유도적(inductive) 버전으로 해석할 수 있다. 제안한 방법은 합성 노이즈(CIFAR-10, CIFAR-100)와 실제 세계적 노이즈(_mini-WebVision, WebVision, Clothing1M, mini-ImageNet-Red)를 포함한 다양한 데이터셋에서 철저히 평가되었으며, 모든 데이터셋에서 경쟁력 있는 또는 최고 수준의 정확도를 달성하였다.