PersFormer: パースペクティブトランスフォーマーを用いた3Dレーン検出とOpenLaneベンチマーク

最近、3D車線検出の方法が提案され、多くの自動運転シナリオ(上り坂/下り坂、段差など)における車線レイアウトの不正確さの問題に対処しています。従来の研究では、フロントビューと鳥瞰図(BEV)間の空間変換の単純な設計や現実的なデータセットの欠如により、複雑なケースでの対応に苦労していました。これらの課題を解決するために、私たちはPersFormerを提示します。これは、カメラパラメータを参照にして関連するフロントビューの局所領域に注目することでBEV特徴を生成する新しいTransformerベースの空間特徴変換モジュールを持つエンドツーエンドの一視点3D車線検出器です。PersFormerは統一された2D/3Dアンカー設計と補助タスクを採用し、2Dおよび3D車線を同時に検出することで特徴の一貫性を高め、マルチタスク学習の利点を共有します。さらに、私たちは大規模な現実世界の3D車線データセットであるOpenLaneを公開します。このデータセットには高品質なアノテーションと多様なシナリオが含まれており、20万フレーム以上、88万件以上のインスタンスレベルの車線、14種類の車線カテゴリに加えて、シーンタグとパス内物体アノテーションが付属しています。これらの要素は車線検出技術や産業に関連した自動運転手法の開発を促進することを目指しています。私たちはPersFormerが新しいOpenLaneデータセットおよびApollo 3D Lane Syntheticデータセットにおいて3D車線検出タスクで競合する基準モデルを大幅に上回ることを示しました。また、OpenLaneデータセット上の2Dタスクでも最先端アルゴリズムと同等の性能を達成しています。プロジェクトページはhttps://github.com/OpenPerceptionX/PersFormer_3DLaneで利用可能であり、OpenLaneデータセットはhttps://github.com/OpenPerceptionX/OpenLaneから提供されています。