2ヶ月前

アクションチューブの検出

Georgia Gkioxari; Jitendra Malik
アクションチューブの検出
要約

ビデオにおける動作検出の問題に取り組んでいます。2次元画像からの物体検出の最新進展を背景に、形状と運動学的ヒントから得られる豊富な特徴階層を使用して動作モデルを構築します。外観と運動を以下の2つの方法で組み込みます。第一に、画像領域提案から動きが目立つ領域を選択し、それにより動作が含まれている可能性が高い領域を絞り込みます。これにより処理する領域の数が大幅に削減され、計算速度が向上します。第二に、空間時間的な特徴表現を抽出し、畳み込みニューラルネットワーク(Convolutional Neural Networks)を使用して強力な分類器を構築します。予測結果を連結して時間的に一貫した検出結果(これをアクションチューブと呼びます)を作成します。実験結果から、当方針は他の技術よりも動作検出タスクにおいて優れた性能を示すことが確認できました。

アクションチューブの検出 | 最新論文 | HyperAI超神経