한 달 전

Anchor Points가 라벨 노이즈 학습에서 정말로 필수적인가?

Xiaobo Xia; Tongliang Liu; Nannan Wang; Bo Han; Chen Gong; Gang Niu; Masashi Sugiyama
Anchor Points가 라벨 노이즈 학습에서 정말로 필수적인가?
초록

라벨 노이즈 학습에서, 깨끗한 라벨이 노이즈 라벨로 바뀌는 확률을 나타내는 \textit{노이즈 전이 행렬}은 \textit{통계적으로 일관된 분류기}를 구축하는 데 중추적인 역할을 합니다. 기존 이론들은 특정 클래스에 거의 확실하게 속하는 데이터 포인트인 \textit{앵커 포인트}를 활용하여 전이 행렬을 학습할 수 있음을 보여주었습니다. 그러나 앵커 포인트가 없을 때, 전이 행렬은 제대로 학습되지 않으며, 이러한 현재의 일관된 분류기는 크게 성능이 저하됩니다. 본 논문에서는 앵커 포인트를 사용하지 않고, 효과적으로 전이 행렬을 학습하여 더 나은 분류기를 구현하기 위한 \textit{전이 수정} ($T$-Revision) 방법을 제안합니다. 특히, 전이 행렬을 학습하기 위해 먼저 앵커 포인트와 유사한 데이터 포인트, 즉 높은 \textit{노이즈 클래스 사후 확률}을 가진 데이터 포인트를 활용하여 초기화합니다. 그런 다음, 분류기와 함께 노이즈 데이터를 사용하여 학습하고 검증할 수 있는 \textit{슬랙 변수}(slack variable)를 추가하여 초기화된 행렬을 수정합니다. 벤치마크 시뮬레이션 및 실제 세계 라벨 노이즈 데이터셋에 대한 실증적 결과는 정확한 앵커 포인트를 사용하지 않아도 제안된 방법이 최신 라벨 노이즈 학습 방법보다 우수함을 입증하였습니다.