8일 전

특성 종속 레이블 노이즈를 통한 학습: 점진적 접근법

Yikai Zhang, Songzhu Zheng, Pengxiang Wu, Mayank Goswami, Chao Chen
특성 종속 레이블 노이즈를 통한 학습: 점진적 접근법
초록

현실 세계의 대규모 데이터셋에서는 레이블 노이즈가 흔히 관찰된다. 이 노이즈는 다양한 원인으로 인해 발생하며, 비균일하고 특징에 의존적인 특성을 가진다. 기존의 노이즈 레이블 처리 방법은 대부분 두 가지 범주로 나뉜다. 하나는 이상적인 특징 독립적 노이즈를 가정하는 것이고, 다른 하나는 이론적 보장 없이 히ュ리스틱적인 접근을 취하는 것이다. 본 논문에서는 기존에 흔히 사용되는 i.i.d. 레이블 노이즈보다 훨씬 더 일반적인 특징에 의존적인 레이블 노이즈의 새로운 가족을 대상으로 한다. 이 일반적인 노이즈 가족에 초점을 맞추어, 반복적으로 레이블을 보정하고 모델을 정교화하는 점진적 레이블 보정 알고리즘을 제안한다. 이전에 알려지지 않은 다양한 노이즈 패턴에 대해, 본 전략으로 학습된 분류기는 베이즈 분류기와 일치하는 결과로 수렴함을 이론적으로 보장한다. 실험 결과, 제안하는 방법은 최첨단(SOTA) 기준선을 능가하며, 다양한 노이즈 유형과 수준에 대해 강건함을 입증하였다.