2ヶ月前

深層多視点歩行者検出の一般化を目指して

Vora, Jeet ; Dutta, Swetanjal ; Jain, Kanishk ; Karthik, Shyamgopal ; Gandhi, Vineet
深層多視点歩行者検出の一般化を目指して
要約

マルチビュー検出(MVD)は、混雑した環境における遮蔽推論に非常に効果的です。近年、深層学習を用いた研究では著しい進展が見られましたが、一般化の側面が見落とされており、これが実世界での適用を困難にしていました。当研究の主要な新規性は、3つの重要な一般化形式を形式化し、それらを評価するための実験を提案することにあります。具体的には、i) カメラ数の変動、ii) カメラ位置の変動、そして最後に iii) 新たなシーンへの一般化について評価します。既存の最先端モデルは単一のシーンとカメラ設定に過学習しているため、一般的な一般化性能が低くあることが判明しました。これらの問題に対処するために:(a) 様々なシーンや時間帯、カメラ設定、カメラ数の変動を取り入れた新しい汎用MVDデータセット(GMVD)を提案し、(b) MVDにおける一般化に必要な特性について議論し、それらを取り入れるための基本的なモデルを提案しています。WildTrack, MultiViewX, およびGMVDデータセットを使用して包括的な実験を行い、MVD手法の一般化能力を評価する必要性と提案手法の有効性を示しています。コードと提案データセットは https://github.com/jeetv/GMVD で公開されています。