
초록
분포적으로 강건한 지도 학습(DRSL)은 신뢰할 수 있는 기계 학습 시스템을 구축하는 데 필수적입니다. 기계 학습이 실제 환경에서 배포될 때, 테스트 데이터의 분포가 훈련 데이터의 분포와 다르기 때문에 성능이 크게 저하될 수 있습니다. f-발산을 사용한 DRSL은 적대적으로 재가중된 훈련 손실을 최소화하여 가장 나쁜 경우의 분포 변화를 명시적으로 고려합니다. 본 논문에서는 분류 시나리오에 초점을 맞추어 이 DRSL을 분석합니다. DRSL이 분포 변화 시나리오를 명시적으로 공식화하였으므로, 우리는 자연스럽게 이를 통해 변동된 분포를 적극적으로 처리할 수 있는 강건한 분류기를 얻을 것으로 예상됩니다. 그러나 놀랍게도, 우리는 DRSL이 주어진 훈련 분포에 정확히 맞는 분류기를 제공한다는 것을 증명하였습니다. 이는 너무 비관적인 결과입니다. 이러한 비관주의는 두 가지 출처에서 발생합니다: 분류에 사용되는 특정 손실 함수들과 DRSL이 강건성을 유지하려고 하는 분포의 다양성이 너무 넓다는 사실입니다. 우리의 분석에 동기를 부여받아, 우리는 이 비관주의를 극복하는 간단한 DRSL을 제안하고 그 효과를 경험적으로 입증하였습니다.