HyperAIHyperAI

Command Palette

Search for a command to run...

SqueezeSeg: 畳み込みニューラルネットワークと再帰的なCRFを用いた3D LiDARポイントクラウドからのリアルタイム道路オブジェクトセグメンテーション

Bichen Wu Alvin Wan Xiangyu Yue Kurt Keutzer

概要

本論文では、3D LiDAR ポイントクラウドからの道路オブジェクトのセマンティックセグメンテーションについて述べます。特に、車両、歩行者、自転車乗りなどの関心のあるインスタンスを検出および分類することを目指しています。この問題をポイントごとの分類問題として定式化し、畳み込みニューラルネットワーク(CNN)に基づくエンドツーエンドのパイプラインであるSqueezeSegを提案します:CNNは変換されたLiDARポイントクラウドを入力とし、直接ポイントごとのラベルマップを出力します。その後、条件付き隨機場(CRF)として実装された再帰層によってラベルマップが洗練されます。インスタンスレベルのラベルは従来のクラスタリングアルゴリズムによって取得されます。我々のCNNモデルはKITTIデータセットから得られたLiDARポイントクラウドで訓練され、ポイントごとのセグメンテーションラベルはKITTIの3Dバウンディングボックスから導き出されます。追加の訓練データを得るため、人気のあるビデオゲーム「Grand Theft Auto V (GTA-V)」にLiDARシミュレータを組み込みました。これにより大量の現実的な訓練データを合成することが可能となりました。我々の実験結果によれば、SqueezeSegは非常に高速かつ安定した実行時間(フレームあたり8.7ミリ秒)で高い精度を達成しており、自動運転アプリケーションにとって非常に望ましい特性を持っています。さらに、合成データでの追加学習により実世界データに対する検証精度が向上しました。我々はソースコードと合成データをオープンソース化する予定です。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています