
초록
심층 신경망의 매우 높은 표현 능력은 레이블이 극도로 노이즈가 많은 경우에도 학습 데이터를 완전히 기억하는 부작용을 초래한다. 노이즈가 많은 레이블에 대한 과적합을 해결하기 위해, 우리는 새로운 내성적인 학습 방법인 SELFIE를 제안한다. 본 연구의 핵심 아이디어는 정확도가 높게 보정 가능한 불완전한 샘플을 선택적으로 재구성하고 활용함으로써, 점진적으로 활용 가능한 학습 샘플의 수를 늘리는 것이다. 이러한 설계를 활용함으로써 SELFIE는 잘못된 보정으로 인한 노이즈 누적 위험을 효과적으로 방지하고, 학습 데이터를 최대한 활용할 수 있다. SELFIE의 우수성을 검증하기 위해 네 가지 실제 또는 합성 데이터셋을 활용해 광범위한 실험을 수행하였다. 그 결과, SELFIE는 두 가지 최첨단 방법과 비교하여 테스트 오차를 크게 개선함을 확인하였다.