11日前

Less is More:3Dポイントクラウドのセマンティックセグメンテーションにおけるタスクおよびモデルの複雑さの低減

Li Li, Hubert P. H. Shum, Toby P. Breckon
Less is More:3Dポイントクラウドのセマンティックセグメンテーションにおけるタスクおよびモデルの複雑さの低減
要約

近年、3D LiDAR点群データの可用性は著しく向上しているものの、ラベル付け(アノテーション)は依然として高コストかつ時間のかかる作業であり、自動運転をはじめとする応用分野における半教師付きセマンティックセグメンテーション手法への需要が高まっている。従来の手法では、セグメンテーション精度を向上させるために比較的大きなバックボーンネットワークを採用する傾向があり、その結果、計算コストが増大するという課題がある。さらに、多くの手法が学習に必要な教師データ量を削減するために均一サンプリング(uniform sampling)を用いるが、これにより性能が最適化されない場合が多く、不十分な結果に終わることがある。本研究では、これらの課題を解決するため、より小型のネットワークアーキテクチャを採用した新しいパイプラインを提案する。本手法は、従来のアプローチと比較して、より少ない教師データ(ground-truth annotations)で優れたセグメンテーション精度を達成可能である。これは、ネットワークのパラメータ数を大幅に削減しつつ、全体的なタスク性能を維持することができる新規の「スパースディープワイズ分離畳み込み(Sparse Depthwise Separable Convolution)モジュール」によって実現される。さらに、訓練データの有効なサブサンプリングを実現するために、センサーの環境内での運動情報を活用し、より多様な訓練フレームサンプルを抽出する「空間時系列冗長フレームダウンサンプリング(Spatio-Temporal Redundant Frame Downsampling; ST-RFD)」という新規手法を提案する。限られたアノテーションデータを効果的に活用するため、LiDARの反射率(reflectivity)に基づいたソフト仮ラベル(soft pseudo-label)手法も併せて提案する。提案手法は、SemantickITTI(59.5@5%)およびScribbleKITTI(58.1@5%)のベンチマークデータセットにおいて、従来の半教師付き手法を上回るmIoU(mean Intersection over Union)を達成しており、使用するラベルデータ量は大幅に削減されている。また、モデルパラメータ数は2.3倍、乗算加算演算数(multiply-add operations)は641倍削減された上で、限られた訓練データ条件下でも顕著な性能向上が確認された。本研究の成果は、「少ないデータでより良い性能を実現する(Less is More)」という新たなアプローチの可能性を示しており、効率的かつ高精度な3D点群セグメンテーションの実現に貢献する。

Less is More:3Dポイントクラウドのセマンティックセグメンテーションにおけるタスクおよびモデルの複雑さの低減 | 最新論文 | HyperAI超神経