
초록
노이즈 있는 레이블을 가진 학습은 감독 학습에서 흔히 발생하는 과제이다. 기존의 접근 방식들은 일반적으로 노이즈 비율, 즉 문제 내 레이블 노이즈의 심각도를 조절하는 일련의 파라미터를 사용자에게 명시적으로 설정하도록 요구한다. 이러한 설정은 일반적으로 주어진 것으로 가정되거나, 추가적인 단계를 통해 추정된다. 본 연구에서는 새로운 손실 함수의 가족인 '피어 손실 함수(Peer Loss Functions)'를 제안한다. 이는 사전에 노이즈 비율을 설정할 필요 없이 노이즈 있는 레이블로부터 학습할 수 있도록 한다. 피어 손실 함수는 표준 경험적 위험 최소화(Empirical Risk Minimization, ERM) 프레임워크 내에서 작동한다. 우리는 약한 조건 하에서, 노이즈가 있는 데이터셋에 대해 피어 손실 함수를 사용하여 ERM을 수행하면, 우리가 접근할 수 없는 정제된 학습 데이터에 대해 ERM을 수행했을 때 얻을 수 있는 최적 또는 근사 최적의 분류기와 동일한 성능을 달성할 수 있음을 보인다. 본 연구에서는 광범위한 실험을 통해 이 결과를 뒷받침한다. 피어 손실은 가능한 노이즈가 있는 학습 레이블을 다룰 때 모델 개발을 단순화하는 방법을 제공하며, 이러한 상황에서 강건한 손실 함수 후보로 제안할 수 있다.