2ヶ月前
Hybrid Fully Convolutional Networks を使用した Actionness 推定
Limin Wang; Yu Qiao; Xiaoou Tang; Luc Van Gool

要約
アクションネスは、特定の位置に一般的な行動インスタンスが含まれる可能性を定量的に評価するために導入されました。アクションネスの正確かつ効率的な推定は、ビデオ分析において重要であり、行動認識や行動検出などの関連タスクにも恩恵をもたらす可能性があります。本論文では、アクションネス推定のための新しい深層アーキテクチャであるハイブリッド完全畳み込みネットワーク(H-FCN)を提案します。このネットワークは、外観FCN(Appearance FCN, A-FCN)と運動FCN(Motion FCN, M-FCN)から構成されています。これらの2つのFCNは、静的な外観と動的な運動の視点からそれぞれアクションネスマップを推定する深層モデルの強力な能力を利用しています。さらに、H-FCNの完全畳み込み特性により、任意のサイズのビデオを効率的に処理することができます。実験はStanford40、UCF Sports、JHMDBという難易度の高いデータセットで行われました。これらの実験結果は、H-FCNがアクションネス推定において以前の手法よりも優れた性能を達成していることを示しています。また、我々は推定されたアクションネスマップを行動提案生成と行動検出に適用しました。その結果、これらのタスクにおける現状の最先端性能を大幅に向上させることに成功しました。