2ヶ月前
CurveFormer: 曲線クエリと注意を用いた3次元レーン検出の曲線伝播による方法
Bai, Yifeng ; Chen, Zhirong ; Fu, Zhangjie ; Peng, Lang ; Liang, Pengpeng ; Cheng, Erkang

要約
3Dレーン検出は自動運転システムにおいて重要な要素の一つです。従来のCNNやトランスフォーマーを基にした手法では、一般的にフロントビュー画像から鳥瞰図(BEV: Bird's-Eye-View)特徴マップを生成し、その後、BEV特徴マップを入力として使用するサブネットワークで3Dレーンを予測していました。このようなアプローチは、BEVとフロントビュー間での明示的な視点変換が必要であり、その変換自体が依然として難問となっています。本論文では、CurveFormerという単一ステージのトランスフォーマーを基にした手法を提案します。この手法は直接3Dレーンパラメータを計算し、困難な視点変換ステップを回避できます。具体的には、曲線クエリを使用して3Dレーン検出を曲線伝播問題として定式化しました。3Dレーンクエリは動的かつ順序付けられたアンカーポイント集合によって表現されます。これにより、トランスフォーマーのデコーダ内で曲線表現を持つクエリが反復的に3Dレーン検出結果を洗練することができます。さらに、曲線クエリと画像特徴との類似性を計算するための曲線クロスアテンションモジュールが導入されました。また、曲線クエリの相対的な画像特徴をより多く捉えることができるコンテキストサンプリングモジュールも提供され、3Dレーン検出性能の向上に寄与します。我々は合成データセットおよび実世界データセットで3Dレーン検出の方法を評価しました。実験結果は、最新の手法と比較して有望な性能が得られることを示しています。各構成要素の有効性はアブレーションスタディを通じて確認されています。