
要約
交通監視カメラによって捉えられた車両の検出と追跡は、スマート交通システムの重要な構成要素である。本論文では、車両の3次元バウンディングボックスを検出するための新規手法を提案する。監視対象シーンの既知の幾何構造を活用し、透視変換を構築するアルゴリズムを提案する。この変換により、3次元バウンディングボックスの検出問題を、1つの追加パラメータを持つ2次元バウンディングボックスの検出問題に簡素化できる。これにより、深層畳み込みネットワークに基づく改良型2次元物体検出器を用いて、車両の3次元バウンディングボックスを検出することが可能となる。得られた既知の3次元バウンディングボックスは、細粒度の車両分類や車両再識別などのタスクの性能向上に活用できる。本手法の検出精度は、BrnoCompSpeedデータセットを用いて既存の最先端手法と比較することで検証された。その結果、速度測定の平均誤差が22%(1.10 km/h → 0.86 km/h)低減し、中央値誤差も33%(0.97 km/h → 0.65 km/h)低減した。また、リコール率も向上し、83.3%から89.3%まで改善された。