11일 전

분포 외 데이터 탐지: 분포 내 클래스 사전을 통한 접근

{Bo Han, Feng Zheng, Tongliang Liu, Hong Chen, Zhen Fang, Feng Liu, Xue Jiang}
분포 외 데이터 탐지: 분포 내 클래스 사전을 통한 접근
초록

사전에 훈련된 내부 분포(in-distribution, ID) 모델을 기반으로, 추론 시점의 외부 분포(out-of-distribution, OOD) 탐지는 추론 단계에서 OOD 데이터를 식별하는 것을 목표로 한다. 그러나 일부 대표적인 방법들은 OOD 데이터가 각 ID 클래스에 속할 확률이 동일하다는 입증되지 않은 가정을 공유하고 있다. 즉, 이러한 OOD-대-ID 확률은 실제로 균일 분포(uniform distribution)를 이룬다는 것이다. 본 논문에서는 이러한 가정이 ID 모델이 클래스 불균형 데이터로 훈련된 경우, 해당 방법들이 효과를 발휘하지 못하게 한다는 점을 지적한다. 다행히도, ID/OOD 클래스와 특징 간의 인과 관계를 분석함으로써, OOD-대-ID 확률이 ID 클래스 사전 확률 분포(class-prior distribution)와 일치해야 하는 일반적인 상황들을 규명하였으며, 기존의 추론 시점 탐지 방법을 개선하기 위한 두 가지 전략을 제안한다. 첫째, 만약 기존 방법이 균일 분포를 명시적으로 사용하고 있다면, 이를 ID 클래스 사전 확률 분포로 대체하는 것이다. 둘째, 그렇지 않은 경우, 사전 훈련된 모델의 소프트맥스 출력과 ID 클래스 사전 확률 분포 간의 유사도에 따라 점수를 재가중하는 것이다. 광범위한 실험 결과는, ID 모델이 불균형 데이터로 사전 훈련된 경우에도 두 전략 모두 OOD 탐지 성능을 향상시킬 수 있음을 보여주며, OOD 탐지에서 ID 클래스 사전 확률의 중요성을 입증한다.

분포 외 데이터 탐지: 분포 내 클래스 사전을 통한 접근 | 최신 연구 논문 | HyperAI초신경