8일 전
인스턴스에 의존적인 노이즈 레이블 학습을 위한 그래픽 모델링
Arpit Garg, Cuong Nguyen, Rafael Felix, Thanh-Toan Do, Gustavo Carneiro

초록
노이즈가 있는 레이블은 딥러닝 생태계에서 피할 수 없지만 문제를 일으키는 요소로, 모델이 쉽게 그에 과적합되기 때문이다. 레이블 노이즈는 대칭적 노이즈, 비대칭적 노이즈, 인스턴스 종속적 노이즈(instance-dependent noise, IDN) 등 다양한 형태가 있으며, 그 중 IDN만이 이미지 정보에 의존하는 특성을 지닌다. 이러한 이미지 정보에 대한 의존성은 IDN이 연구할 가치가 높은 중요한 노이즈 유형이 되게 만든다. 왜냐하면 이미지 속 시각적 클래스에 대한 정보가 부족하거나 모호할 경우 레이블링 오류가 주로 발생하기 때문이다. IDN을 효과적으로 다룰 수 있는 기법을 제안하기 위해, 판별적 모델과 생성적 모델을 결합한 새로운 그래픽 모델링 기법인 InstanceGM을 제안한다. InstanceGM의 주요 기여점은 다음과 같다: i) 생성적 모델 학습에 연속 베르누이 분포(continuous Bernoulli distribution)를 사용하여 학습 과정에서 큰 장점을 제공하며, ii) 최신 기술 수준의 노이즈 레이블 판별 분류기(Noisy-label discriminative classifier)를 탐색하여 인스턴스 종속적 노이즈 레이블 샘플로부터 정제된 레이블을 생성한다. InstanceGM은 현재의 노이즈 레이블 학습 기법들과 경쟁력 있는 성능을 보이며, 특히 합성 및 실세계 데이터셋을 활용한 IDN 벤치마크에서 대부분의 실험에서 경쟁 기법들보다 높은 정확도를 나타낸다.