8일 전

이미지와 그들의 정제된 레이블 및 노이즈 있는 레이블 간의 관계를 부트스트래핑하기

Brandon Smart, Gustavo Carneiro
이미지와 그들의 정제된 레이블 및 노이즈 있는 레이블 간의 관계를 부트스트래핑하기
초록

최근의 고성능 노이즈 레이블 학습 방법들은 대부분 학습 과정 중에 샘플의 정제된 레이블을 추정하고 원래의 노이즈 있는 레이블을 버리는 학습 메커니즘에 의존한다. 그러나 이러한 접근 방식은 이미지, 노이즈 레이블, 정제된 레이블 간의 관계를 학습하는 것을 방해하며, 특히 인스턴스에 따라 달라지는 레이블 노이즈 문제를 다룰 때 이 관계가 유용하다는 것이 이미 입증된 바 있다. 더불어, 이러한 관계를 학습하려는 기존 방법들은 정제된 레이블이 부여된 데이터 하위 집합과 함께, 복잡한 디스틸레이션 또는 다중 구조 모델을 사용한 학습이 필요하다. 본 논문에서는 정제된 레이블이 부여된 하위 집합 없이도 정제된 레이블과 노이즈 레이블 간의 관계를 학습할 수 있는 간단한 모델에 기반한 새로운 학습 알고리즘을 제안한다. 제안하는 알고리즘은 다음과 같은 3단계 프로세스를 따르며: 1) 자기지도 학습을 통한 사전 학습 후 분류기의 조기 정지 학습을 통해 학습 데이터셋의 일부에 대해 정제된 레이블을 신뢰성 있게 예측함; 2) 단계(1)에서 확보한 정제된 데이터셋을 활용하여 이미지, 노이즈 레이블, 정제된 레이블 간의 관계를 부트스트랩하고, 이를 바탕으로 반지도 학습을 통해 나머지 학습 데이터셋에 대해 효과적인 재레이블링 수행; 3) 단계(2)에서 재레이블링된 모든 샘플을 사용하여 분류기의 지도 학습을 수행함. 이러한 관계를 학습함으로써, 비대칭적이고 인스턴스에 따라 달라지는 레이블 노이즈 문제에서 최신 기준 성능을 달성한다.