17일 전

합성 음성 데이터에서의 강건 학습을 통한 밀도 높은 이상 탐지

Matej Grcić, Petra Bevandić, Zoran Kalafatić, Siniša Šegvić
합성 음성 데이터에서의 강건 학습을 통한 밀도 높은 이상 탐지
초록

표준 머신러닝은 훈련 분포에 속하지 않는 입력을 처리할 수 없다. 이로 인해 생성된 모델은 잘못된 예측에 대해 과도하게 자신감을 갖게 되며, 이는 치명적인 결과를 초래할 수 있다. 특히 밀도 높은 예측(dense prediction)의 맥락에서 이 문제는 더욱 심각하다. 왜냐하면 입력 이미지가 부분적으로 이상치(anomalous)일 수 있기 때문이다. 기존의 연구들은 사전에 준비된 부정 샘플 데이터셋을 기반으로 구분적(discriminative) 훈련을 통해 밀도 높은 이상치 탐지 문제를 다뤄왔다. 그러나 현실 세계의 부정 샘플은 전체 시각 세계의 모든 모드(mode)를 포괄하기 어렵다. 이를 해결하기 위해 우리는 이 접근법을 확장하여, 정상 샘플의 다양체(manifold) 경계에 따라 합성된 부정 패치를 생성한다. 우리는 커버리지 중심의 학습 목표와 다양한 해상도에서 샘플을 생성할 수 있는 능력을 갖춘 공동 훈련된 정규화 흐름(normalizing flow)을 활용한다. 이상치 탐지는 훈련과 추론 과정에서 일관되게 적용 가능한 원리적인 정보이론적 기준에 따라 수행된다. 이러한 방법으로 개발된 모델은 도로 주행 환경 및 원격 탐사 이미지에서의 이상치 탐지 벤치마크에서 최신 기준을 수립하였으며, 계산 오버헤드는 최소한으로 유지하고 있다.

합성 음성 데이터에서의 강건 학습을 통한 밀도 높은 이상 탐지 | 최신 연구 논문 | HyperAI초신경