要約
最近の集団人数推定に関する研究では、画像全体の人数を推定するのではなく、検出された個体を基に人数をカウントするアプローチが注目されている。しかし、従来の集団局在手法は、個体の頭部点または頭部領域を直接検出するため、グリッド外に位置する出力に対して責任を持たないという問題がある。本研究では、新しい集団人数推定および局在手法として、アノンチャフリー検出を活用する疑似正方形ラベルネットワーク(Pseudo Square Label Network, PSL-Net)を提案する。PSL-Netは、中心点が責任グリッド(responsible grid)に含まれる確率を予測する一方で、ボックス回帰とセンターネス推定を通じて、責任グリッド外の個体を間接的に検出する。本研究では、固定サイズの正方形領域を点ラベルの周囲に生成することで、疑似正方形ラベル(Pseudo Square Label, PSL)を用いた教師信号を提案する。さらに、学習フェーズではPSL内でのみマッチングを行う部分的many-to-oneマッチングアルゴリズムを設計し、正確なラベル割り当てを実現した。推論フェーズでは、センターネスを用いて予測された点をその責任グリッドに関連付ける。その結果、PSL-Netは集団人数推定において最も代表的なデータセットであるShanghaiTech Part AおよびPart Bで最先端の性能を達成しただけでなく、点検出に基づく集団局在手法においても、最新の性能を実現した。