13日前

MRCNet:航空画像および地上画像における混雑人数推定と密度マップ推定

Reza Bahmanyar, Elenora Vig, Peter Reinartz
MRCNet:航空画像および地上画像における混雑人数推定と密度マップ推定
要約

大規模イベントにおける群衆監視・管理において航空画像の利点は多岐にわたりますが、航空画像を用いた群衆データセットは依然として不足しています。これを補うために、本研究では新たに「DLR航空群衆データセット(DLR-ACD)」を提案します。DLR-ACDは、16回の飛行調査により取得された33枚の大規模航空画像から構成されており、合計226,291人の人物がアノテーションされています。知られている限り、DLR-ACDは世界初の航空群衆データセットであり、公開される予定です。航空画像における正確な群衆数推定および密度マップ推定という課題に対処するため、本研究では新たなエンコーダ・デコーダ型畳み込みニューラルネットワーク、すなわち「マルチリゾリューション群衆ネットワーク(MRCNet)」を提案します。エンコーダはVGG-16ネットワークに基づき、デコーダは双線形補間(bilinear upsampling)と畳み込み層の組み合わせで構成されています。MRCNetは、デコーダの初期段階と最終段階の両方で損失関数を用いることで、群衆数の推定と高解像度の群衆密度マップの推定という、互いに密接に関連する2つのタスクを同時に行います。さらに、特徴量ピラミッドネットワーク(FPN)のアイデアを参考に、複数の横方向接続(lateral connections)により高レベルと低レベルの特徴を統合することで、文脈情報と詳細な局所情報を効果的に活用しています。本研究では、提案したDLR-ACDデータセットおよび、CCTVを用いた群衆数推定のベンチマークとして広く用いられるShanghaiTechデータセットの両方でMRCNetの性能を評価しました。その結果、航空画像およびCCTV画像の両方において、MRCNetが最先端の群衆数推定手法を上回る性能を示しました。

MRCNet:航空画像および地上画像における混雑人数推定と密度マップ推定 | 最新論文 | HyperAI超神経