2ヶ月前

位置、サイズ、およびカウント:密集した群衆での人物の正確な検出

Deepak Babu Sam; Skand Vishwanath Peri; Mukuntha Narayanan Sundararaman; Amogh Kamath; R. Venkatesh Babu
位置、サイズ、およびカウント:密集した群衆での人物の正確な検出
要約

密集な群衆のカウント検出フレームワークを導入し、一般的な密度回帰パラダイムの必要性を排除します。典型的なカウントモデルは、画像全体の群衆密度を予測する一方で、個々の人間を検出することはしません。これらの回帰方法は、数え上げ以外のほとんどのアプリケーションにおいて、十分に正確に個人を局在化することができないため、私たちは群衆内のすべての人間を特定し、Bounding Boxを使用して見つけた頭部の大きさを推定し、その後カウントを行うアーキテクチャを採用しました。通常の物体や顔検出器と比較して、このような検出システムを設計する際には固有の課題が存在します。その一部は、密集した群衆における多様性の高さと連続的なボックス予測の必要性から直接派生しています。これらの問題に対処するために、私たちはLSC-CNNモデルを開発しました。このモデルは、疎から密集までのさまざまな群衆において信頼性のある頭部検出が可能です。LSC-CNNは、トップダウンフィードバック処理を使用したマルチカラムアーキテクチャを採用しており、これにより複数解像度でのより精緻な予測が可能になります。興味深いことに、提案された学習体制では点頭部注釈のみが必要ですが(point head annotation)、頭部の概算サイズ情報を推定することができます。私たちはLSC-CNNが既存の密度回帰器よりも優れた局在化性能を持つだけでなく、カウント性能も上回ることを示しました。当方針に関するコードは https://github.com/val-iisc/lsc-cnn で公開されています。注:「点頭部注釈」(point head annotation)という表現は一般的ではないかもしれませんが、「点」で頭部位置を指定する注釈方法であることを明確にするために使用しました。

位置、サイズ、およびカウント:密集した群衆での人物の正確な検出 | 最新論文 | HyperAI超神経