SqueezeSegV2: リダーレーザー点群からの道路オブジェクトセグメンテーションのための改良されたモデル構造と非監督ドメイン適応

以前の研究では、深層学習に基づくアプローチが点群セグメンテーションにおいて有望であることが示されていますが、これらのアプローチは実用的に有用になるために改善が必要です。この目的のために、LiDAR点群におけるドロップアウトノイズにより頑健な新しいモデルSqueezeSegV2を提案します。改良されたモデル構造、訓練損失関数、バッチ正規化および追加の入力チャネルにより、SqueezeSegV2は実データで訓練された場合に大幅な精度向上を達成しています。点群セグメンテーションのためのモデルの訓練には大量のラベル付き点群データが必要ですが、その取得コストは高額です。このような収集と注釈のコストを回避するために、GTA-Vなどのシミュレータを使用して無限の量のラベル付き合成データを作成することができます。しかし、ドメインシフト(領域移動)の影響により、合成データで訓練されたモデルはしばしば実世界に十分に一般化できません。この問題に対処するため、我々は以下の3つの主要なコンポーネントからなるドメイン適応訓練パイプラインを提案します:1) 学習による強度レンダリング (learned intensity rendering)、2) 地形相関アライメント (geodesic correlation alignment)、3) 段階的なドメインキャリブレーション (progressive domain calibration)。実データで訓練した場合、我々の新しいモデルは元のSqueezeSegに対して6.0-8.6%のセグメンテーション精度向上を示しました。また、提案されたドメイン適応パイプラインを使用して合成データで新しいモデルを訓練すると、実世界データでのテスト精度がほぼ倍増し、29.0%から57.4%へと向上しました。我々はソースコードと合成データセットをオープンソース化する予定です。