8日前

注視する視点を投影する:クロスビュー変換を用いた単眼道路シーンレイアウト推定

{Jia Pan, Shengfeng He, Yuexin Ma, Yuanlong Yu, Wenxi Liu, Qi Li, Weixiang Yang}
注視する視点を投影する:クロスビュー変換を用いた単眼道路シーンレイアウト推定
要約

自動運転における高精細地図(HDマップ)の再構築は極めて重要である。LiDARベースの手法は、高価なセンサーの設置と計算時間の長さという制約により限界がある。一方、カメラベースの手法は通常、道路セグメンテーションと視点変換を別々に処理する必要があり、これにより歪みや情報の欠落が生じることが多い。技術の限界を押し広げるため、本研究では、前方視点の単眼画像のみを入力として、道路構造と車両占有領域からなる局所的なマップを鳥瞰図(Bird's-eye view)で再構築するための新しいフレームワークを提案する。特に、視点間の循環整合性(cycle consistency)を制約条件として取り入れ、視点間の相関関係を最大限に活用するクロスビュー変換モジュールを設計した。また、車両と道路の関係性に着目し、結果の精度をさらに向上させるためにコンテキストに配慮したディスクリミネーターを導入した。公開ベンチマーク上での実験結果から、本手法は道路構造推定および車両占有領域推定の両タスクにおいて、最先端の性能を達成していることが示された。特に後者のタスクでは、他のすべての手法と比べて顕著な性能向上を実現した。さらに、単一のGPU上で35 FPSの処理速度を達成しており、リアルタイムでのパノラマHDマップ再構築に実用可能であることが確認された。