2ヶ月前

マハラノビス距離に基づく多視点最適輸送法を用いた多視点群衆位置特定

Zhang, Qi ; Zhang, Kaiyi ; Chan, Antoni B. ; Huang, Hui
マハラノビス距離に基づく多視点最適輸送法を用いた多視点群衆位置特定
要約

多視点群衆位置推定は、シーン内のすべての人の地面位置を予測します。一般的な手法では通常、まず地面平面上の群衆密度マップを推定し、その後群衆の位置を得ます。しかし、既存の手法の性能は混雑したエリアでの密度マップの曖昧さによって制限されており、局所的なピークが滑らかに消えてしまうことがあります。密度マップ監督の弱点を緩和するために、単一画像群衆位置推定タスクでは最適輸送に基づく点監督手法が提案されていますが、多視点群衆位置推定にはまだ応用されていません。そこで本論文では、多視点群衆位置推定のために特別に設計された新しいマルハノビス距離に基づく多視点最適輸送(M-MVOT)損失関数を提案します。まず、ユークリッド距離に基づく輸送コストをマルハノビス距離で置き換えます。これにより、コスト関数内で楕円形の等高線が定義され、その長軸と短軸方向は視線方向によって誘導されます。次に、各視点における物体からカメラまでの距離を使用して、各位置の最適輸送コストをさらに調整します。ここで、カメラから遠い場所での誤った予測に対する罰則がより重くなります。最後に、モデル損失(M-MVOT)においてすべての入力カメラビューを考慮する戦略を提案します。これは、各真値ポイントに対して最も近いカメラに基づいて最適輸送コストを計算することによって実現されます。実験結果は、いくつかの多視点群衆位置推定データセット上で、提案手法が密度マップベースや一般的なユークリッド距離ベースの最適輸送損失よりも優れていることを示しています。プロジェクトページ: https://vcc.tech/research/2024/MVOT.

マハラノビス距離に基づく多視点最適輸送法を用いた多視点群衆位置特定 | 最新論文 | HyperAI超神経