2ヶ月前
時系列アクション検出における構造化セグメントネットワーク
Yue Zhao; Yuanjun Xiong; Limin Wang; Zhirong Wu; Xiaoou Tang; Dahua Lin

要約
未編集のビデオにおける行動検出は重要な課題であり、同時に困難を伴っています。本論文では、構造化セグメントネットワーク(SSN)という新しいフレームワークを提案します。このフレームワークは、各行動インスタンスの時間的な構造を構造化された時間ピラミッドを通じてモデル化します。さらに、このピラミッドの上に、行動分類と完全性判定のための2つの分類器からなる分解型識別モデルを導入しています。これにより、フレームワークは背景や不完全な提案から肯定的な提案を効果的に区別することができ、正確な認識と位置特定につながります。これらのコンポーネントは統一されたネットワークに統合され、エンドツーエンドで効率的に学習することができます。また、単純ながら効果的な時間的行動提案スキームである「時間的アクションネスグループング(Temporal Actionness Grouping: TAG)」を開発し、高品質な行動提案を生成しています。THUMOS14およびActivityNetという2つの難易度の高いベンチマークにおいて、当手法は従来の最先端手法を大幅に上回り、様々な時間構造を持つ行動に対処する際の優れた精度と強い適応性を示しています。