13일 전

다수의 사전 훈련된 모델을 활용한 분포 외 탐지 성능 향상

Feng Xue, Zi He, Chuanlong Xie, Falong Tan, Zhenguo Li
다수의 사전 훈련된 모델을 활용한 분포 외 탐지 성능 향상
초록

분포 외(In-Distribution, OOD) 탐지란, 입력 데이터가 학습에 사용된 분포와는 다른 새로운 분포에서 샘플링되었는지를 식별하는 작업으로, 머신러닝 시스템을 오픈 월드 환경에서 안전하게 배포하기 위해 필수적인 과제이다. 최근, 사전 학습된 모델을 활용한 후처리 기반(OOD) 탐지 기법이 뛰어난 성능을 보이며 대규모 문제에까지 확장 가능한 가능성을 보여주고 있다. 이러한 발전은 자연스럽게 다음과 같은 질문을 제기한다: 다양한 사전 학습된 모델들의 다양성을 활용하여 후처리 탐지 방법의 성능을 향상시킬 수 있는가? 본 연구에서는 사전 학습된 모델의 다양한 집합(모델 자료관, model zoo)에서 도출된 다수의 탐지 결정을 앙상블하는 방식을 제안한다. 제안된 접근법은 일반적으로 사용되는 하드 임계값 대신 p-값을 사용하며, 다중 가설 검정의 기본 프레임워크를 활용하여 내부 분포(In-Distribution, ID) 데이터의 참 긍정률(True Positive Rate)을 제어한다. 본 연구는 모델 자료관의 활용에 초점을 맞추고, 다양한 OOD 탐지 벤치마크에서 최신 기술 수준의 방법들과 체계적인 실험적 비교를 수행한다. 제안된 앙상블 전략은 단일 모델 기반 탐지기보다 일관된 성능 향상을 보이며, 기존의 경쟁적 방법들에 비해 크게 우수한 성능을 나타낸다. 특히 CIFAR-10 및 ImageNet 벤치마크에서 상대적 성능을 각각 65.40%, 26.96% 향상시켰다.