8일 전

PSSCL: 노이즈 있는 레이블을 위한 대비 손실을 갖춘 점진적 샘플 선택 프레임워크

{Qiu Chen, Filipe R. Cordeiro, Yi Zhu, Qian Zhang}
초록

대규모 이미지 데이터셋은 자주 불가피한 노이즈 레이블을 포함하고 있으며, 이는 심층 신경망에서 과적합을 유발하고 성능 저하를 초래한다. 기존의 노이즈 레이블 학습을 위한 대부분의 방법들은 훈련 데이터 분할과 반감독 학습(SSL)이 최적화 과정에서 혼합된 단일 단계 프레임워크를 사용한다. 이로 인해 이러한 방법의 효과성은 분리된 정제된 데이터셋의 정확도, 노이즈에 대한 사전 지식, 그리고 SSL의 강건성에 크게 영향을 받는다. 본 논문에서는 대상 노이즈 레이블에 대해 진행형 샘플 선택 프레임워크를 제안하며, 이는 대조 손실(contrastive loss)을 활용하는 PSSCL(Predictive Sample Selection with Contrastive Loss)이라고 한다. 이 프레임워크는 두 단계로 구성되며, 강건성과 대조 손실을 통해 모델의 강건성을 강화한다. 1단계는 장기적인 신뢰도 탐지 전략을 통해 작은 정제된 데이터셋을 식별하는 데 집중하며, 2단계는 이 정제된 데이터셋을 확장함으로써 성능을 향상시키는 것을 목표로 한다. PSSCL은 최첨단 기법들과 비교하여 다양한 벤치마크에서 상당한 성능 향상을 보였다. 코드는 https://github.com/LanXiaoPang613/PSSCL 에서 제공된다.