17일 전

노이즈 있는 레이블에 대한 신경망의 강건한 훈련을 위한 코어셋

Baharan Mirzasoleiman, Kaidi Cao, Jure Leskovec
노이즈 있는 레이블에 대한 신경망의 강건한 훈련을 위한 코어셋
초록

현대의 신경망은 실제 데이터셋에서 흔히 발견되는 노이즈가 있는 레이블에 과적합(overfit)할 수 있는 능력을 가지고 있다. 비록 큰 진전이 이루어졌지만, 기존 기법들은 노이즈가 있는 레이블로 훈련된 신경망의 성능에 대해 이론적인 보장을 제공하는 데 한계가 있다. 본 연구에서는 노이즈가 있는 레이블로 훈련된 딥 네트워크에 대해 강력한 이론적 보장을 갖춘 새로운 접근법을 제안한다. 제안하는 방법의 핵심 아이디어는 정제된 데이터 포인트들의 가중치 부여된 부분집합(코어셋, coresets)을 선택하여, 이들의 야코비안 행렬(Jacobian matrix)이 근사적으로 낮은 랭크(low-rank)를 갖도록 하는 것이다. 우리는 이러한 부분집합에 대해 그라디언트 하강법(gradient descent)을 적용할 경우 노이즈 레이블에 과적합되지 않음을 증명한다. 광범위한 실험 결과는 본 연구의 이론을 뒷받침하며, 제안한 부분집합을 기반으로 훈련된 딥 네트워크가 기존 최고 수준의 기법보다 훨씬 뛰어난 성능을 보임을 입증한다. 예를 들어, CIFAR-10 데이터셋에서 노이즈 레이블 비율이 80%일 때 정확도가 6% 향상되었으며, mini Webvision에서는 7%의 정확도 향상이 관측되었다.

노이즈 있는 레이블에 대한 신경망의 강건한 훈련을 위한 코어셋 | 최신 연구 논문 | HyperAI초신경