17일 전

스켈레톤 기반 비디오 이상 탐지를 위한 다중모달 운동 조건부 확산 모델

Alessandro Flaborea, Luca Collorone, Guido D&#39, Amely, Stefano D&#39, Arrigo, Bardh Prenkaj, Fabio Galasso
스켈레톤 기반 비디오 이상 탐지를 위한 다중모달 운동 조건부 확산 모델
초록

이상은 흔하지 않으며, 따라서 이상 탐지 문제는 종종 단일 클래스 분류(One-Class Classification, OCC)로 모델링된다. 즉, 정상 상태 데이터만으로 학습하는 방식이다. 최첨단 OCC 기법들은 정상적인 움직임의 잠재 표현(latent representation)을 제한된 범위 내에 유지하도록 제약하고, 그 외의 모든 것을 이상으로 판단함으로써 이상의 개방 집합(open-set) 특성을 적절히 반영한다. 그러나 정상 상태 역시 동일한 개방 집합 특성을 지닌다. 왜냐하면 인간은 동일한 동작을 여러 가지 방식으로 수행할 수 있기 때문이다. 그러나 현재의 선도적 기법들은 이러한 특성을 간과하고 있다. 본 연구에서는 정상과 비정상 모두 다중 모달(multimodal)임을 가정하는 새로운 생성 모델을 제안한다. 우리는 뼈대(skeletal) 표현을 고려하고 최첨단 확산 확률 모델(diffusion probabilistic models)을 활용하여 다중 모달 미래 인간 자세를 생성한다. 또한, 사람의 과거 움직임에 대한 새로운 조건부 조건(conditioning)을 도입하고, 확산 과정이 향상된 모드 커버리지(mode coverage) 능력을 지닌다는 점을 활용하여, 서로 다른 그러나 타당한 미래 움직임을 생성한다. 미래의 다양한 모드를 통계적으로 통합한 후, 생성된 움직임 집합이 실제 미래와 관련성이 없을 경우 이상으로 탐지한다. 제안된 모델은 UBnormal, HR-UBnormal, HR-STC, HR-Avenue 등 네 가지 주요 벤치마크에서 광범위한 실험을 통해 검증되었으며, 기존 최고 성능(SOTA)을 초월하는 결과를 보였다.