17日前
AZTR:オートズームおよび時系列推論を用いた空中映像行動認識
Xijun Wang, Ruiqi Xian, Tianrui Guan, Celso M. de Melo, Stephen M. Nogar, Aniket Bera, Dinesh Manocha

要約
我々は、無人航空機(UAV)で撮影された空中動画における行動認識のための新規アプローチを提案する。本手法は、UAVによって取得された動画を対象とし、エッジデバイスやモバイルデバイス上で実行可能なように設計されている。本研究では、カスタマイズされた自動ズーム技術を用いた学習ベースのアプローチを提示する。この技術により、人間の対象を自動的に検出しつつ、適切なスケールに調整することが可能となる。これにより、重要な特徴量の抽出が容易になり、計算負荷の低減も実現できる。さらに、計算コストを制御可能な範囲で維持しつつ、空間的・時間的領域における行動情報を効率的に捉えるための高速な時系列推論アルゴリズムも提案する。本手法は、高性能GPUを搭載したデスクトップ環境および、低消費電力型のロボット・ドローン用プラットフォームであるRobotics RB5上で実装・評価された。実際の評価において、RoCoG-v2データセットではTop-1精度でSOTA(最先端)比で6.1~7.4%の向上、UAV-Humanデータセットでは8.3~10.4%の向上、Drone Actionデータセットでは3.2%の向上を達成した。