Command Palette
Search for a command to run...
SqueezeSeg: 畳み込みニューラルネットワークと再帰的なCRFを用いた3D LiDARポイントクラウドからのリアルタイム道路オブジェクトセグメンテーション
SqueezeSeg: 畳み込みニューラルネットワークと再帰的なCRFを用いた3D LiDARポイントクラウドからのリアルタイム道路オブジェクトセグメンテーション
Bichen Wu Alvin Wan Xiangyu Yue Kurt Keutzer
概要
本論文では、3D LiDAR ポイントクラウドからの道路オブジェクトのセマンティックセグメンテーションについて述べます。特に、車両、歩行者、自転車乗りなどの関心のあるインスタンスを検出および分類することを目指しています。この問題をポイントごとの分類問題として定式化し、畳み込みニューラルネットワーク(CNN)に基づくエンドツーエンドのパイプラインであるSqueezeSegを提案します:CNNは変換されたLiDARポイントクラウドを入力とし、直接ポイントごとのラベルマップを出力します。その後、条件付き隨機場(CRF)として実装された再帰層によってラベルマップが洗練されます。インスタンスレベルのラベルは従来のクラスタリングアルゴリズムによって取得されます。我々のCNNモデルはKITTIデータセットから得られたLiDARポイントクラウドで訓練され、ポイントごとのセグメンテーションラベルはKITTIの3Dバウンディングボックスから導き出されます。追加の訓練データを得るため、人気のあるビデオゲーム「Grand Theft Auto V (GTA-V)」にLiDARシミュレータを組み込みました。これにより大量の現実的な訓練データを合成することが可能となりました。我々の実験結果によれば、SqueezeSegは非常に高速かつ安定した実行時間(フレームあたり8.7ミリ秒)で高い精度を達成しており、自動運転アプリケーションにとって非常に望ましい特性を持っています。さらに、合成データでの追加学習により実世界データに対する検証精度が向上しました。我々はソースコードと合成データをオープンソース化する予定です。