17일 전

입력 복잡도와 가능도 기반 생성 모델을 이용한 분포 외 탐지

Joan Serrà, David Álvarez, Vicenç Gómez, Olga Slizovskaia, José F. Núñez, Jordi Luque
입력 복잡도와 가능도 기반 생성 모델을 이용한 분포 외 탐지
초록

확률 기반 생성 모델은 기계 학습 시스템의 견고성 또는 신뢰성을 해칠 수 있는 분포 외 입력(Out-of-Distribution, OOD)을 탐지하는 데 유망한 자원으로 여겨지고 있다. 그러나 이러한 모델로부터 도출된 확률 값이 학습 데이터와 크게 다른 특정 유형의 입력을 탐지하는 데 문제를 겪고 있다는 점이 이미 지적된 바 있다. 본 논문에서는 이러한 문제의 원인이 생성 모델의 확률 값에 지나치게 큰 영향을 미치는 입력 복잡도에 있음을 제안한다. 본 연구는 이 가설을 뒷받침하는 일련의 실험 결과를 보고하며, 입력 복잡도의 추정치를 활용하여 효율적이고 파라미터가 필요 없는 OOD 점수를 도출한다. 이 점수는 베이지안 모델 비교와 유사한 확률 비율(Likelihood-ratio)로 해석할 수 있다. 다양한 데이터셋, 모델, 모델 크기 및 복잡도 추정 방법에 걸쳐, 이와 같은 점수가 기존의 OOD 탐지 기법들과 비교하여 동등하거나 더 우수한 성능을 보임을 발견하였다.

입력 복잡도와 가능도 기반 생성 모델을 이용한 분포 외 탐지 | 최신 연구 논문 | HyperAI초신경