17일 전

정규성 학습을 통한 명시적 분포 모델링을 활용한 뼈대 영상 이상 탐지

Shoubin Yu, Zhongyin Zhao, Haoshu Fang, Andong Deng, Haisheng Su, Dongliang Wang, Weihao Gan, Cewu Lu, Wei Wu
정규성 학습을 통한 명시적 분포 모델링을 활용한 뼈대 영상 이상 탐지
초록

감시 영상에서의 이상 탐지는 공공 안전을 보장하기 위해 매우 도전적이면서도 중요한 과제이다. 픽셀 기반 이상 탐지 방법과 달리, 자세 기반 방법은 높은 구조성을 지닌 스켈레톤 데이터를 활용함으로써 계산 부담을 줄이고 배경 노이즈의 부정적 영향을 회피할 수 있다. 그러나 픽셀 기반 방법이 광학 흐름(optical flow)과 같은 명시적인 운동 특징을 직접 활용할 수 있는 반면, 자세 기반 방법은 대체 동적 표현이 부족한 문제가 있다. 본 논문에서는 확률적 관점에서 자세 운동 표현을 제공하기 위해 새로운 모션 임베더(Motion Embedder, ME)를 제안한다. 또한, 자가 지도적 자세 시퀀스 재구성 작업을 위한 새로운 작업 특화형 공간-시간 트랜스포머(Spatial-Temporal Transformer, STT)를 도입한다. 이 두 모듈은 통합된 프레임워크 내에 결합되어 자세 규칙성 학습을 수행하며, 이를 '모션 프라이어리 규칙성 학습기(Motion Prior Regularity Learner, MoPRL)'라 한다. MoPRL은 여러 도전적인 데이터셋에서 평균적으로 AUC가 4.7% 향상되어 최신 기술 수준(SOTA)의 성능을 달성하였다. 광범위한 실험을 통해 제안된 각 모듈의 유연성과 일반화 능력이 입증되었다.

정규성 학습을 통한 명시적 분포 모델링을 활용한 뼈대 영상 이상 탐지 | 최신 연구 논문 | HyperAI초신경