2ヶ月前
3D ランダムオクルージョンとマルチレイヤープロジェクションを用いた深層マルチカメラ歩行者位置特定
Qiu, Rui ; Xu, Ming ; Yan, Yuyao ; Smith, Jeremy S. ; Yang, Xi

要約
単眼歩行者検出の深層学習ベースの手法は大きな進歩を遂げていますが、依然として重度の遮蔽に対して脆弱です。マルチビュー情報融合は潜在的な解決策ですが、既存のマルチビューデータセットに注釈付き訓練サンプルが不足しているため、適用範囲が限定的であり、過学習のリスクが高まっています。この問題に対処するために、データ拡張手法が提案されました。この手法では、地上平面上で歩行者の平均サイズに相当する3次元円筒形の遮蔽物をランダムに生成し、複数の視点に投影することで、訓練時の過学習の影響を軽減します。さらに、各視点の特徴マップを異なる高さにある複数の平行平面にホモグラフィを使用して投影することで、CNN(畳み込みニューラルネットワーク)が各歩行者の高さ方向にわたる特徴を十分に活用し、地上平面上での歩行者の位置を推定することができます。提案された3DROM手法は、最新の深層学習ベースのマルチビューステッピング検出手法と比較して大幅な性能向上を達成しています。