12日前

極めて密集な群衆画像におけるマルチソース・マルチスケールカウンティング

{Imran Saleemi, Haroon Idrees, Mubarak Shah, Cody Seibert}
極めて密集な群衆画像におけるマルチソース・マルチスケールカウンティング
要約

本研究では、単一の画像に映し出された極めて密集した群衆に存在する人物数を推定するため、複数の情報源を活用する手法を提案する。このような画像において、視点の歪み、人物同士の隠蔽(オクルージョン)、雑然とした背景、および一人当たりのピクセル数が極めて少ないといった問題により、従来の人物検出に基づくカウントはほぼ不可能である。そこで本手法は、低信頼度の頭部検出、SIFTを用いたテクスチャ要素の繰り返しパターン、周波数領域解析といった複数の情報源を統合し、画像領域における人物の存在確信度を伴った人数推定を行う。さらに、マルコフ確率場(Markov Random Field)を用いたグローバルな一貫性制約を導入することで、局所的な近傍領域および異なるスケール間におけるカウントの乖離を補正する。本手法の有効性を検証するために、64,000人分のラベルが付与された50枚の群衆画像から構成される新しいデータセットを用いた実験を行った。このデータセットにおける頭部数は94~4,543人と、従来の手法で用いられるデータセット(数十人程度)と比べて著しく規模が大きい。実験により、提案手法の精度と信頼性を定量的に示し、その有効性を実証した。

極めて密集な群衆画像におけるマルチソース・マルチスケールカウンティング | 最新論文 | HyperAI超神経