
초록
최근 딥러닝 분야의 발전은 고용량 모델을 훈련시키기 위해 대규모의 레이블이 부여된 데이터셋에 의존해 왔다. 그러나 시간과 비용 측면에서 대규모 데이터셋을 수집하는 과정은 종종 레이블 노이즈를 초래한다. 본 연구에서는 특성 공간 내 훈련 예제 간의 유사성을 활용하여, 각 예제의 예측이 그에 가장 가까운 이웃들과 유사하도록 유도하는 노이즈 레이블 학습 방법을 제안한다. 기존의 다수 모델을 사용하거나 별도의 단계를 거치는 훈련 알고리즘들과 달리, 본 방법은 간단한 추가 정규화 항(Regularization Term) 형태로 구현된다. 이는 전통적인 비유도적(label propagation) 알고리즘의 유도적(inductive) 버전으로 해석할 수 있다. 제안한 방법은 합성 노이즈(CIFAR-10, CIFAR-100)와 실제 세계적 노이즈(_mini-WebVision, WebVision, Clothing1M, mini-ImageNet-Red)를 포함한 다양한 데이터셋에서 철저히 평가되었으며, 모든 데이터셋에서 경쟁력 있는 또는 최고 수준의 정확도를 달성하였다.