17일 전

AZTR: 자동 줌 및 시간적 추론을 활용한 공중 영상 동작 인식

Xijun Wang, Ruiqi Xian, Tianrui Guan, Celso M. de Melo, Stephen M. Nogar, Aniket Bera, Dinesh Manocha
AZTR: 자동 줌 및 시간적 추론을 활용한 공중 영상 동작 인식
초록

우리는 무인 항공기(UAV)를 이용해 촬영한 항공 영상을 위한 새로운 동작 인식 기법을 제안한다. 본 방법은 UAV 영상에 특화되어 있으며, 엣지 또는 모바일 기기에서도 실시간으로 실행 가능한 구조를 갖추고 있다. 우리는 사용자 정의 자동 줌(auto zoom) 기술을 활용한 학습 기반 접근법을 제시하며, 이를 통해 인간 대상을 자동으로 탐지하고 적절한 크기로 스케일링한다. 이는 핵심 특징을 보다 효과적으로 추출하고 계산 부담을 줄이는 데 기여한다. 또한, 제어 가능한 계산 비용 내에서 공간적·시간적 영역에 걸쳐 동작 정보를 효과적으로 포착할 수 있는 효율적인 시간적 추론 알고리즘을 제안한다. 제안된 방법은 고성능 GPU를 탑재한 데스크탑 환경과 저전력 로봇용 RB5 플랫폼(로봇 및 드론용) 모두에서 구현 및 평가되었으며, 실제 실험 결과 RoCoG-v2 데이터셋에서 Top-1 정확도 기준으로 기존 최고 수준(SOTA) 대비 6.1~7.4% 향상, UAV-Human 데이터셋에서는 8.3~10.4% 향상, Drone Action 데이터셋에서는 3.2% 향상하는 성과를 달성하였다.

AZTR: 자동 줌 및 시간적 추론을 활용한 공중 영상 동작 인식 | 최신 연구 논문 | HyperAI초신경