Command Palette
Search for a command to run...
SqueezeSegV3:効率的なポイントクラウドセグメンテーションのための空間適応型畳み込み
SqueezeSegV3:効率的なポイントクラウドセグメンテーションのための空間適応型畳み込み
Chenfeng Xu Bichen Wu Zining Wang Wei Zhan Peter Vajda Kurt Keutzer Masayoshi Tomizuka
概要
LiDAR点群セグメンテーションは、多くの応用において重要な課題である。大規模な点群セグメンテーションにおいて、実質的な標準的手法は、3次元点群を2次元LiDAR画像に投影し、畳み込み演算を用いて処理することである。RGB画像とLiDAR画像の類似性は高いものの、本研究では、LiDAR画像における特徴分布が画像内の異なる位置で急激に変化することを発見した。標準的な畳み込み演算を用いてこのようなLiDAR画像を処理することは問題を引き起こす。なぜなら、畳み込みフィルタは画像内の特定領域でのみ活性化される局所的な特徴に依存してしまうため、ネットワークの表現能力が十分に活用されず、セグメンテーション性能が低下するからである。この問題を解決するために、入力画像に応じて異なるフィルタを各位置に適応的に適用する空間適応型畳み込み(Spatially-Adaptive Convolution, SAC)を提案する。SACは、要素ごとの乗算、im2col変換、および標準的な畳み込み演算の組み合わせとして効率的に実装可能である。また、SACは汎用的なフレームワークであり、既存のいくつかの手法を特別なケースとして包含することができる。本手法を活用して、LiDAR点群セグメンテーション用のSqueezeSegV3を構築した結果、SemanticKITTIベンチマークにおいて、推論速度をほぼ同等に保ちながら、従来のすべての発表手法を3.7%以上のmIoU(平均交差率)で上回ることに成功した。