11日前
時系列行動候補の高速学習:密結合境界生成器を用いた手法
Chuming Lin, Jian Li, Yabiao Wang, Ying Tai, Donghao Luo, Zhipeng Cui, Chengjie Wang, Jilin Li, Feiyue Huang, Rongrong Ji

要約
時間的行動提案(temporal action proposals)の生成は、長時間かつカットされていない実世界動画において、正確な提案境界を予測し、信頼性の高い行動信頼度を取得するという非常に困難な課題である。本論文では、境界に敏感な手法に着想を得て、密に分布する提案に対して境界分類と行動完全性回帰を統合的に実装する、効率的かつ統一的なフレームワークである「Dense Boundary Generator(DBG)」を提案する。特に、DBGは2つのモジュールから構成される:時間的境界分類(Temporal Boundary Classification, TBC)と行動に敏感な完全性回帰(Action-aware Completeness Regression, ACR)。TBCは低レベルの二重ストリーム特徴量を用いて、2つの時間的境界信頼度マップを生成することを目的とする。一方、ACRは高レベルの行動に敏感な特徴量を用いて、行動完全性スコアマップを生成する。さらに、RGB画像と光流(optical flow)情報を効果的に統合するため、二重ストリームベースネットワーク(Dual Stream BaseNet, DSB)を導入し、識別的な境界特徴および行動性(actionness)特徴の抽出を支援する。ActivityNet-1.3およびTHUMOS14という代表的なベンチマークデータセットにおける広範な実験結果から、従来の最先端の提案生成手法(例:MGG、BMN)と比較して、DBGの優位性が実証された。本研究の実装コードは論文公開後に公開予定である。