2달 전

분포 외 샘플과 적대적 공격을 감지하기 위한 간단한 통합 프레임워크

Kimin Lee; Kibok Lee; Honglak Lee; Jinwoo Shin
분포 외 샘플과 적대적 공격을 감지하기 위한 간단한 통합 프레임워크
초록

훈련 분포에서 충분히 멀리 떨어진 테스트 샘플을 통계적으로 또는 적대적으로 감지하는 것은 많은 실제 머신 러닝 응용 프로그램에서 좋은 분류기를 배포하기 위한 기본적인 요구사항입니다. 그러나 소프트맥스 분류기를 사용한 딥 신경망은 이러한 비정상 샘플에서도 매우 과도하게 확신 있는 후방확률 분포를 생성하는 것으로 알려져 있습니다. 본 논문에서는 어떤 비정상 샘플이든 감지할 수 있는 간단하면서도 효과적인 방법을 제안합니다. 이 방법은 사전 학습된 소프트맥스 신경 분류기에 적용할 수 있습니다. 우리는 가우시안 판별 분석 하에서 딥 모델의 (낮은 수준과 고수준) 특징에 대한 클래스 조건부 가우시안 분포를 얻어 마할라노비스 거리를 기반으로 한 신뢰 점수를 도출합니다. 대부분의 이전 방법들이 either out-of-distribution 또는 적대적 샘플 감지를 평가했지만 두 경우 모두 평가하지는 않았습니다. 제안된 방법은 실험에서 두 경우 모두 최고 성능을 달성하였습니다. 또한, 우리는 제안된 방법이 훈련 데이터셋에 노이즈 라벨이 있거나 샘플 수가 적은 등 어려운 상황에서도 더 강건하다는 것을 발견했습니다. 마지막으로, 제안된 방법이 더 넓은 범위에서 활용될 수 있음을 보여주기 위해 클래스 증분 학습에 적용하였습니다: out-of-distribution 샘플이 감지되면, 우리의 분류 규칙은 추가적인 딥 모델 학습 없이 새로운 클래스를 잘 통합할 수 있습니다.