11일 전
분포 외 탐지를 위한 워터마킹
Qizhou Wang, Feng Liu, Yonggang Zhang, Jing Zhang, Chen Gong, Tongliang Liu, Bo Han

초록
분포 외(out-of-distribution, OOD) 탐지는 잘 훈련된 딥 모델로부터 추출한 표현을 기반으로 OOD 데이터를 식별하는 것을 목표로 한다. 그러나 기존의 방법들은 딥 모델의 재프로그래밍(reprogramming) 성질을 거의 간과하고 있으며, 이로 인해 모델이 내재적으로 가진 잠재적 능력을 충분히 발휘하지 못할 수 있다. 즉, 잘 훈련된 딥 모델의 파라미터를 수정하지 않고도 데이터 수준에서의 조작(예: 데이터에 특정한 특징 방해를 추가하는 것)을 통해 모델을 새로운 목적에 맞게 재프로그래밍할 수 있다는 점이 핵심이다. 이러한 성질을 기반으로 본 연구에서는 분류 모델을 OOD 탐지(새로운 작업)에 특화되도록 재프로그래밍하는 일반적인 방법론을 제안한다. 이를 위해 우리는 원본 데이터의 특징에 중첩되는 통합된 패턴을 학습하며, 이 패턴을 적용한 워터마킹(watermarking) 후 모델의 탐지 성능이 크게 향상됨을 확인하였다. 광범위한 실험을 통해 워터마킹 기법의 효과성을 검증하였으며, 딥 모델의 재프로그래밍 성질이 OOD 탐지에서 매우 중요한 역할을 한다는 점을 입증하였다.