2ヶ月前
大規模シーンにおける多視点人検出のための監督的視点別寄与度重み付け
Zhang, Qi ; Gong, Yunfei ; Chen, Daijie ; Chan, Antoni B. ; Huang, Hui

要約
最近の深層学習に基づく多視点人物検出(Multi-View People Detection: MVD)手法は、既存のデータセットにおいて有望な結果を示しています。しかし、現在の手法は主に少数の単一シーンで、限られた数の多視点フレームと固定されたカメラビューを使用して訓練および評価されています。その結果、これらの手法は、深刻な遮蔽やカメラキャリブレーション誤差がある大きな複雑なシーンでの人物検出には実用的ではない可能性があります。本論文では、大規模なシーンにおいて多カメラ情報をより効果的に融合するための監督的な視点ごとの寄与度重み付けアプローチを開発し、多視点人物検出の性能向上に焦点を当てています。また、大規模な合成データセットを採用することで、モデルの汎化能力を高め、より実践的な評価と比較が可能となっています。さらに、単純なドメイン適応技術により、新しいテストシーンにおけるモデルの性能も向上しています。実験結果は、我々のアプローチが有望なクロスシーン多視点人物検出性能を達成する有効性を示しています。コードについてはこちらをご覧ください: https://vcc.tech/research/2024/MVD.