16일 전

분포 외 예시의 탐지: 분포 내 예시 및 그램 행렬을 활용한 방법

Chandramouli Shama Sastry, Sageev Oore
분포 외 예시의 탐지: 분포 내 예시 및 그램 행렬을 활용한 방법
초록

분포 외(In-Distribution, OOD) 예시가 제시될 때, 심층 신경망은 확신을 갖고 잘못된 예측을 내놓는다. OOD 예시를 탐지하는 것은 어려운 과제이며, 그로 인한 잠재적 위험은 매우 크다. 본 논문에서는 활성화 패턴과 예측된 클래스 간의 불일치를 탐지함으로써 OOD 예시를 식별하는 새로운 방법을 제안한다. 우리는 그람 행렬(Gram matrix)을 활용하여 활성화 패턴을 특성화하고, 그람 행렬 값 내의 이상치를 식별함으로써 높은 OOD 탐지 성능을 달성할 수 있음을 발견하였다. 이때, 각 값이 훈련 데이터에서 관측된 범위와 단순히 비교함으로써 그람 행렬 내의 이상치를 식별한다. 많은 기존 방법들과 달리, 본 방법은 사전 훈련된 소프트맥스 분류기와 어떤 아키텍처에서도 호환 가능하며, 하이퍼파라미터 조정을 위한 OOD 데이터 접근이 필요 없으며, 인자 추정 시에도 OOD 데이터에 접근할 필요가 없다. 제안한 방법은 다양한 아키텍처와 비전 데이터셋에 적용 가능하며, 특히 분포에서 멀리 떨어진 OOD 예시를 탐지하는 매우 중요하면서도 예상치 못하게 어려운 과제에서, OOD 데이터 접근을 전제로 하는 기존 최첨단 방법들(또는 그와 유사한 접근법들)과 비교하여 일반적으로 더 나은 성능을 보이거나 동등한 성능을 발휘한다.

분포 외 예시의 탐지: 분포 내 예시 및 그램 행렬을 활용한 방법 | 최신 연구 논문 | HyperAI초신경