2ヶ月前
CPGNet: カスケード型ポイント・グリッド融合ネットワークによるリアルタイムLiDARセマンティックセグメンテーション
Xiaoyan Li; Gang Zhang; Hongyu Pan; Zhenhua Wang

要約
高度自動運転に不可欠なLiDARセマンティックセグメンテーションは、精度が高く、高速で、モバイルプラットフォームへの導入が容易であることが求められます。従来のポイントベースやスパースボクセルベースの手法は、時間のかかる近傍探索やスパース3D畳み込みを用いているため、実時間応用から遠ざかっています。最近の2D投影ベースの手法(レンジビューとマルチビュー融合を含む)は実時間で動作しますが、2D投影時に情報が失われるため、精度が低下するという問題があります。また、性能向上のために従来の手法では通常、テスト時拡張(TTA)を採用していますが、これにより推論プロセスがさらに遅くなる傾向があります。より良い速度-精度トレードオフを達成するために、我々はカスケードポイント-グリッド融合ネットワーク(Cascade Point-Grid Fusion Network, CPGNet)を提案します。このネットワークは主に以下の2つの技術によって効果性と効率性を両立させています:1) 新しいポイント-グリッド(PG)融合ブロックは、効率性のために主に2D投影されたグリッド上でセマンティック特徴を抽出しますが、最小限の情報損失で2Dおよび3D特徴を3Dポイント上で要約します;2) 提案された変換一貫性損失は、単回モデル推論とTTAとの間のギャップを縮めます。SemanticKITTIおよびnuScenesベンチマークでの実験結果によると、CPGNetはアンサンブルモデルやTTAを使用せずに最先端のRPVNetと同等の性能を示し、かつ4.7倍速い動作が可能です。