17日前

Flow Guided Recurrent Neural Encoder を用いた動画顕著オブジェクト検出

{Liang Lin, Keze Wang, Tianhao Wei, Guanbin Li, Yuan Xie}
Flow Guided Recurrent Neural Encoder を用いた動画顕著オブジェクト検出
要約

近年、深層畳み込みニューラルネットワークの発展により、画像のサリエンシー検出は著しい進展を遂げている。しかし、最先端の画像サリエンシー検出器を動画へ拡張することは困難である。動画では、物体やカメラの運動、および外観コントラストの急激な変化により、顕著なオブジェクト検出の性能が低下する。本論文では、動画における顕著オブジェクト検出のための高精度でエンドツーエンド学習可能なフレームワークである「フローガイド・リカレントニューラルエンコーダ(FGRNE)」を提案する。FGRNEは、各フレームの特徴量の時間的整合性を高めるために、光流(optical flow)に基づく運動情報と、LSTMネットワークによる順次的特徴進化の符号化を併用する。このアプローチは、任意のFCNベースの静的サリエンシー検出器を動画用に拡張する汎用的なフレームワークと見なすことができる。詳細な実験結果により、FGRNEの各構成要素の有効性が検証され、DAVISおよびFBMSの公開ベンチマークにおいて、本手法が最先端手法を顕著に上回ることを確認した。