16日前

シーン間を跨ぐ集団人数推定:深層畳み込みニューラルネットワークを用いた手法

{Xiaokang Yang, Cong Zhang, Hongsheng Li, Xiaogang Wang}
シーン間を跨ぐ集団人数推定:深層畳み込みニューラルネットワークを用いた手法
要約

クロスシーンの群衆数え上げは、訓練データに含まれなかった新たな監視シーンにおける人間の数をカウントする際、手作業によるデータアノテーションを必要としない挑戦的なタスクである。既存の多くの群衆数え上げ手法は、未観測のシーンに適用される際に性能が著しく低下するという問題を抱えている。この課題に対処するため、本研究では、群衆密度と群衆数の二つの関連する学習目的を交互に最適化する深層畳み込みニューラルネットワーク(CNN)を提案する。この提案するスイッチ可能な学習アプローチにより、両方の目的関数に対してより良い局所最適解を達成できる。未観測のターゲットシーンに対応するため、訓練済みCNNモデルをターゲットシーンに適合させるデータ駆動型のファインチューニング手法を提示する。群衆数え上げ手法の精度をより正確に評価できるよう、約20万件の頭部アノテーションを含む108の群衆シーンから構成される新規データセットを導入した。提案手法について、本研究で用意したデータセットおよび他の二つの既存データセットを用いた広範な実験により、本手法の有効性と信頼性が実証された。

シーン間を跨ぐ集団人数推定:深層畳み込みニューラルネットワークを用いた手法 | 最新論文 | HyperAI超神経