2ヶ月前

単一画像から3Dレーン形状とカメラ姿勢を予測する学習 幾何制約を用いて

Liu, Ruijin ; Chen, Dapeng ; Liu, Tie ; Xiong, Zhiliang ; Yuan, Zejian
単一画像から3Dレーン形状とカメラ姿勢を予測する学習
  幾何制約を用いて
要約

カメラから3Dレーンを検出することは、自動車の自律走行にとって急速に注目される問題となっています。この課題において、正確なカメラ姿勢は、透視図像を上空図像に変換するための鍵となります。この変換により、透視効果を排除し、3Dレーンが類似した形状となり、低次多項式によって正確に適合させることができます。しかし、主流の3Dレーン検出器は他のセンサーによって提供される完璧なカメラ姿勢に依存しており、これは高コストであり、複数センサーの校正問題にも遭遇します。この問題を克服するために、我々は単一画像からカメラ姿勢を推定する二段階フレームワークを用いて3Dレーンを予測することを提案します。第一段階では、透視図像からのカメラ姿勢推定を行います。姿勢推定の精度向上のために、補助的な3Dレーンタスクと幾何学的制約を導入し、マルチタスク学習による恩恵を受けます。これにより、3Dと2D間の一貫性が向上し、上記2つのタスクとの互換性も向上します。第二段階では3Dレーン検出タスクに焦点を当てます。ここでは、以前に推定された姿勢を使用して距離不変のレーン形状を持つ上空図像を作成し、正確な3Dレーン予測を行います。実験結果は示していますが、真値のカメラ姿勢なしで我々の方法は現行の完璧なカメラ姿勢に基づく手法よりも優れており、最も少ないパラメータ数と計算量を持っています。コードは https://github.com/liuruijin17/CLGo で公開されています。