2ヶ月前

Crowd Counting用のConvolutional Neural Networkの切り替え

Deepak Babu Sam; Shiv Surya; R. Venkatesh Babu
Crowd Counting用のConvolutional Neural Networkの切り替え
要約

私たちは、与えられた群衆シーンをその密度にマッピングする新しい群衆カウントモデルを提案します。群衆分析は、極度の混雑による人々の相互遮蔽、人々と背景要素との外見の高い類似性、カメラ視点の大きな変動性などの多様な要因によって複雑化されます。現在の最先端アプローチでは、これらの要因に対処するために、マルチスケールCNNアーキテクチャ、リカレントネットワーク、異なる受容野を持つマルチカラムCNNからの特徴量の後期融合を使用しています。私たちは、画像内の群衆密度の変動を利用して予測された群衆数の精度と位置特定を向上させるスイッチング畳み込みニューラルネットワーク(CNN)を提案します。訓練中に確立されたCNNの群衆数予測品質に基づいて、グリッド内の群衆シーンから独立したCNN回帰器へパッチが伝達されます。独立したCNN回帰器は異なる受容野を持つように設計され、スイッチ分類器が訓練されて最適なCNN回帰器に群衆シーンパッチを伝達します。私たちは主要なすべての群衆カウントデータセットで広範な実験を行い、現行の最先端手法よりも優れた性能を示す証拠を提供しました。また、スイッチから推論された群衆シーンパッチ空間の多義性について解釈可能な表現も提供しています。観察によると、スイッチは画像パッチを特定のCNNカラムに伝達し、これは群衆密度に基づいて行われます。注:「multichotomy」は一般的な日本語では使用されない専門用語であるため、「多義性」と訳しました。「multichotomy」(原文)という言葉がより正確な意味を持つ場合や他の訳語をご希望でしたらご指摘ください。

Crowd Counting用のConvolutional Neural Networkの切り替え | 最新論文 | HyperAI超神経