
초록
분포 외 데이터(Out-of-distribution, OOD) 탐지는 신경망의 안전한 배포를 강화하는 데 있어 실용적인 중요성이 높아지면서 최근 많은 주목을 받고 있다. 주요 과제 중 하나는 모델이 OOD 데이터에 대해 높은 신뢰도를 가진 예측을 내는 경우가 많다는 점이다. 이는 OOD 탐지의 핵심 원리—즉, 모델은 오직 분포 내 데이터(in-distribution)에 대해서만 신뢰할 수 있어야 한다—를 약화시킨다. 본 연구에서는 OOD 데이터에 대한 모델의 과도한 자신감을 줄이는 간단하면서도 효과적인 기법인 ReAct을 제안한다. 본 방법은 신경망의 내부 활성화에 대한 새로운 분석에 기반하며, 이 분석은 OOD 분포에 대해 매우 특징적인 서명 패턴(signature patterns)을 보여준다. 제안한 방법은 다양한 네트워크 아키텍처와 다양한 OOD 탐지 점수에 대해 효과적으로 일반화될 수 있다. 우리는 실험적으로 ReAct이 포괄적인 벤치마크 데이터셋에서 경쟁력 있는 탐지 성능을 달성함을 입증하였으며, 본 방법의 효과성에 대해 이론적 설명을 제시한다. ImageNet 벤치마크에서 ReAct은 이전 최고 성능 방법 대비 95%의 정상 긍정률(FPR95)을 25.05% 감소시켰다.