2ヶ月前

社会場面理解:エンドツーエンドの多人数行動位置特定と集団活動認識

Timur Bagautdinov; Alexandre Alahi; François Fleuret; Pascal Fua; Silvio Savarese
社会場面理解:エンドツーエンドの多人数行動位置特定と集団活動認識
要約

私たちは、生の画像シーケンスにおける人間の社会的行動を理解するための一貫したフレームワークを提示します。私たちのモデルは、単一のニューラルネットワークによる前向き伝播を通じて、複数の個体を検出するとともに、それらの社会的行動を推論し、集団行動を推定します。外部の検出アルゴリズムに依存せず、一貫して訓練された単一のアーキテクチャを提案しており、このアー�キテクチャは密度の高い提案マップを生成し、新しい推論スキームにより精緻化されます。時間的一貫性はパーソンレベルでのマッチング用リカレントニューラルネットワークによって処理されます。完全なモデルはフレームのシーケンスを受け取り、検出結果と個々の行動および集団活動の推定値を出力します。私たちは公開されている複数のベンチマークで当該アルゴリズムが最先端の性能を示すことを実証しています。