15日前
物体数え上げのための畳み込みネットワークの空間不変性の再考
Zhi-Qi Cheng, Qi Dai, Hong Li, JingKuan Song, Xiao Wu, Alexander G. Hauptmann

要約
従来の研究では、畳み込みネットワークの空間不変性を向上させることこそが物体カウントの鍵であると一般的に考えられてきた。しかし、いくつかの主流のカウントネットワークを検証した結果、驚くことに、過度に厳格なピクセルレベルの空間不変性は密度マップ生成時に過剰なノイズを引き起こすことが明らかになった。本研究では、密度マップにおける空間的位置推定に、従来の畳み込みフィルタの代わりに局所接続型のガウスカーネルを用いる手法を提案する。この目的は、特徴抽出プロセスが密度マップ生成プロセスに影響を与える可能性を高め、アノテーションノイズの影響を軽減することにある。過去の研究に着想を得て、低ランク近似と並進不変性を組み合わせることで、大規模なガウス畳み込みの近似を効果的に実現する手法を提案する。本研究は、今後の研究において物体カウントのための過度に厳格なピクセルレベルの空間不変性を適切に緩和する方法を検討すべきであるという新たな方向性を示唆している。提案手法は、MCNN、CSRNet、SANet、ResNet-50の4つの主流な物体カウントネットワーク上で評価され、3つの応用分野(集団、車両、植物のカウント)における7つの代表的なベンチマークで広範な実験が実施された。実験結果から、本手法が他の最先端手法を顕著に上回り、物体の空間的位置に関する有望な学習性能を達成していることが示された。