13日前
FAR:フーリエ航空動画認識
Divya Kothandaraman, Tianrui Guan, Xijun Wang, Sean Hu, Ming Lin, Dinesh Manocha

要約
我々は、無人航空機(UAV)映像における行動認識を目的としたアルゴリズム「Fourier Activity Recognition(FAR)」を提案する。本手法は、通常小さく、背景と混在しやすい人間エージェントを本質的に分離するための新たなフーリエオブジェクト分離法を採用している。この分離技術は周波数領域で動作し、空間ピクセルの時間的変化の程度を特徴づける。さらに、フーリエ変換の畳み込み・乗算の性質を活用して、ネットワークから得られるオブジェクト-背景混合特徴へとこの表現をマッピングする。文脈情報および長距離の空間時間依存性を捉えるために、新たなフーリエアテンション(Fourier Attention)アルゴリズムを提案する。このアテンション形式は、周波数領域における重み付き外積をモデル化することで、自己アテンション(self-attention)の利点を模倣する。フーリエアテンションは、従来の自己アテンションと比較して大幅に少ない計算量で実現可能である。本手法は、UAV Human RGB、UAV Human Night、Drone Action、NEC Drone といった複数のUAVデータセット上で評価された。その結果、トップ-1精度において前人研究比8.02%~38.69%の相対的な向上が確認され、処理速度は最大で3倍高速化された。