2ヶ月前
単眼カメラを用いた深層学習検出とPMBMフィルタリングによる3D多物体追跡
Samuel Scheidegger; Joachim Benjaminsson; Emil Rosenberg; Amrit Krishnan; Karl Granstrom

要約
単眼カメラは、自動車産業において自動運転車両で最も一般的に使用されるセンサーの一つです。単眼カメラを使用する際の主な欠点は、観測が2次元画像平面上のみに行われ、物体までの距離を直接測定できないことです。本論文では、このギャップを埋めるために、入力として画像を取り込み、検出された物体の軌跡を世界座標系で生成する多物体追跡アルゴリズムを開発することを目指しています。これは、単一の入力画像から物体を検出し、その距離を推定するように訓練された深層ニューラルネットワークを使用して解決します。一連の画像からの検出結果は、最先端のポアソン・マルチベルヌーイ混合追跡フィルター(Poisson multi-Bernoulli mixture tracking filter)に供給されます。学習済み検出器とPMBMフィルターの組み合わせにより、単眼カメラ画像のみを入力として3次元追跡を行うアルゴリズムが実現しました。本アルゴリズムの性能は、公開されているKITTIオブジェクト追跡データセットを使用して、3次元世界座標および2次元画像座標の両方で評価されました。評価結果によると、本アルゴリズムは物体を正確に追跡し、画像内での物体の大規模な重複即使ってもデータ関連付けを適切に処理できることを示しており、KITTIオブジェクト追跡ベンチマークにおいて最上位のパフォーマンスを持つアルゴリズムの一つとなっています。さらに、本アルゴリズムは効率的であり、平均して秒間約20フレームで動作します。