17일 전

이질분산 및 불균형한 딥러닝에 대한 적응형 정규화

Kaidi Cao, Yining Chen, Junwei Lu, Nikos Arechiga, Adrien Gaidon, Tengyu Ma
이질분산 및 불균형한 딥러닝에 대한 적응형 정규화
초록

실세계의 대규모 데이터셋은 비동질분산성(heteroskedastic)이고 불균형한 특성을 지닌다. 즉, 레이블에는 다양한 수준의 불확실성이 존재하며, 레이블 분포는 긴 꼬리(long-tailed) 형태를 띤다. 비동질분산성과 불균형은 잘못 레이블링된 데이터, 모호한 예, 희귀 예를 구분하는 데 어려움을 초래하여 딥러닝 알고리즘에 도전을 안긴다. 비동질분산성과 불균형을 동시에 해결하는 연구는 아직 충분히 탐색되지 않았다. 본 연구에서는 비동질분산성 데이터셋을 위한 데이터 의존적 정규화 기법을 제안한다. 이 기법은 입력 공간의 각 영역에 대해 서로 다른 방식으로 정규화를 수행한다. 일차원 비모수 분류 설정에서 최적의 정규화 강도에 대한 이론적 도출을 영감으로 삼아, 본 연구의 접근법은 불확실성이 높고 밀도가 낮은 영역의 데이터 포인트에 더 강하게 적응형 정규화를 적용한다. 제안한 방법은 WebVision을 포함한 여러 벤치마크 작업에 대해 검증되었으며, 실세계의 비동질분산성 및 불균형 데이터셋에서 효과를 입증하였다. 실험 결과는 이론적 근거를 뒷받침하며, 노이즈에 강한 딥러닝 기법에서 기존 방법들에 비해 상당한 성능 향상을 보여준다.