8일 전
엄밀하게 끝에서 끝까지의 레이블 노이즈 학습: 앵커 포인트 없이
Xuefeng Li, Tongliang Liu, Bo Han, Gang Niu, Masashi Sugiyama

초록
라벨 노이즈 학습에서 전이 행렬(transition matrix)은 통계적으로 일관된 분류기를 구축하는 데 핵심적인 역할을 한다. 기존의 전이 행렬에 대한 일관된 추정기들은 앵커 포인트(anchor points)를 활용하여 개발되어 왔다. 그러나 실세계 상황에서는 앵커 포인트 가정이 항상 성립하는 것은 아니다. 본 논문에서는 앵커 포인트 없이도 라벨 노이즈 학습 문제를 해결할 수 있는 엔드투엔드 프레임워크를 제안한다. 이 프레임워크에서는 신경망이 예측한 확률과 노이즈가 있는 라벨 사이의 교차 엔트로피 손실, 그리고 전이 행렬의 열들로 형성된 단순체(simplex)의 부피를 동시에 최적화한다. 제안하는 프레임워크는 정제된 클래스 사후 확률(class-posterior probabilities)이 충분히 분포되어 있는 경우 전이 행렬을 식별할 수 있다. 이는 현재까지 전이 행렬이 증명 가능하게 식별 가능하고, 학습된 분류기가 통계적으로 일관되게 유지될 수 있는 가장 낮은 조건(가장 온화한 가정)이다. 기준 데이터셋에 대한 실험 결과는 제안한 방법의 효과성과 강건성을 입증한다.