8일 전

VFP290K: 시각 기반 낙상자 탐지를 위한 대규모 벤치마크 데이터셋

{Simon S. Woo, Donghee Hong, Saebyeol Shin, Minha Kim, Junhyung Kang, Jinbeom Kim, Hanbeen Lee, Jeongho Kim, Jaeju An}
VFP290K: 시각 기반 낙상자 탐지를 위한 대규모 벤치마크 데이터셋
초록

건강 문제, 폭력, 사고 등으로 인한 낙상 사례를 탐지하는 것은 매우 중요한 과제이다. 따라서 이러한 비정상적 사건을 탐지하는 것은 CCTV 감시, 보안, 의료 분야를 포함한 다양한 응용 분야에서 극도로 중요하다. 많은 탐지 시스템이 다양한 환경과 상황에서 수집된 낙상자 이미지를 포함하는 포괄적인 데이터셋에 의존하고 있으나, 기존의 데이터셋은 특정 환경 조건에 국한되어 있으며 다양성이 부족한 실정이다. 이러한 문제를 해결하고 연구자들이 더욱 견고한 탐지 시스템을 개발할 수 있도록 지원하기 위해, 한국 정부의 지원을 받아 다양한 실제 상황에서 촬영된 낙상자 이미지로 구성된 새로운 대규모 데이터셋을 구축하였다. 본 연구에서 제안하는 시각 기반 낙상자 데이터셋(Vision-based Fallen Person, VFP290K)은 178개의 영상에서 추출한 총 294,713 프레임의 낙상자 이미지를 포함하며, 49개의 장소에서 촬영된 131개의 장면을 포함한다. 우리는 다양한 객체 탐지 모델을 기반으로 한 광범위한 실험을 통해 제안된 특징의 효과성을 실증적으로 입증하였다. 또한, 데이터셋을 적절히 분할한 버전을 활용하여 낙상자 탐지 시스템의 성능을 측정함으로써 VFP290K 데이터셋의 유효성을 평가하였다. 본 데이터셋을 활용해 2020년 한국 AI 그랜드 챌린지의 비정상 행동 인식 트랙 1라운드에서 1위를 차지하였으며, 해당 결과는 아래 링크에서 확인할 수 있다. 본 성과는 VFP290K 데이터셋이 낙상자 탐지 연구에 매우 유용할 뿐만 아니라, 지능형 CCTV 또는 모니터링 시스템과 같은 다른 응용 분야로의 확장 가능성도 시사한다. 데이터셋과 최신 정보는 VFP290K 공식 사이트에서 제공된다.

VFP290K: 시각 기반 낙상자 탐지를 위한 대규모 벤치마크 데이터셋 | 최신 연구 논문 | HyperAI초신경