2달 전
CleanNet: 라벨 노이즈가 있는 대규모 이미지 분류기 훈련을 위한 전이 학습
Kuang-Huei Lee; Xiaodong He; Lei Zhang; Linjun Yang

초록
본 논문에서는 라벨 노이즈가 있는 이미지 분류 모델 학습 문제를 연구합니다. 기존의 인간 감독에 의존하는 접근 방식은 수작업으로 올바른 라벨과 잘못된 라벨을 식별하는 것이 시간이 많이 소요되기 때문에 일반적으로 확장성이 없습니다. 반면에 인간 감독을 필요로 하지 않는 접근 방식은 확장성이 있지만 효과가 덜합니다. 라벨 노이즈 정리를 위한 인간 감독의 양을 줄이기 위해, 우리는 CleanNet이라는 공동 신경 임베딩 네트워크를 소개합니다. 이 네트워크는 일부 클래스만 수작업으로 검증하면 그 지식을 다른 클래스로 전달할 수 있습니다. 또한, 우리는 CleanNet과 일반적인 컨볼루션 신경망 분류기를 하나의 프레임워크로 통합하여 이미지 분류 학습을 수행합니다. 우리는 제안된 알고리즘의 유효성을 여러 대규모 데이터셋에서 라벨 노이즈 탐지 작업과 노이즈가 포함된 데이터에서의 이미지 분류 작업을 통해 입증하였습니다. 실험 결과, CleanNet은 현재 약간의 감독 방법보다 held-out 클래스(인간 감독 없음)에서 라벨 노이즈 탐지 오류율을 41.5% 낮출 수 있음을 보여주었습니다. 또한, 모든 이미지를 검증하는 것에 비해 3.2%의 이미지만 검증하여도 이미지 분류 작업에서 47%의 성능 향상을 달성하였습니다. 소스 코드와 데이터셋은 kuanghuei.github.io/CleanNetProject에서 제공될 예정입니다.