
自律システムは、限られた計算リソースのもとで大規模かつ疎な不規則な点群を処理する必要がある。そのため、効率的かつ効果的なLiDAR認識手法の開発が不可欠である。3Dカーネルサイズを単純に拡大することで性能向上が可能ではあるが、その一方で計算負荷は立方則的に増大する。したがって、冗長な重みを排除しつつ、大規模なカーネルを効果的に活用できる簡潔な3D大カーネル設計の開発が重要となる。本論文では、動的プリューニングを活用して3Dカーネルサイズを拡張する効率的かつ効果的な大規模疎カーネル3Dニューラルネットワーク(LSK3DNet)を提案する。本手法は、2つの核心構成要素からなる:空間方向における動的スパース性(Spatial-wise Dynamic Sparsity, SDS)とチャネル方向における重み選択(Channel-wise Weight Selection, CWS)。SDSは初期段階からボリューム的重みを動的にプリューニングおよび再生成することで、大規模な疎な3Dカーネルを学習する。これにより性能の向上だけでなく、モデルサイズと計算コストの大幅な削減も実現する。さらに、CWSは学習中に3D畳み込みにおいて最も重要なチャネルを選択し、冗長なチャネルをプリューニングすることで、3Dビジョンタスクにおける推論速度を向上させる。LSK3DNetの有効性は、3つのベンチマークデータセットおよび5つの評価トラックにおいて、従来のモデルおよび大カーネル設計と比較して検証された。特に、SemanticKITTIにおいて、単スキャン時で75.6%、マルチスキャン時で63.4%という最先端の性能を達成した。また、単純な大規模3Dカーネルモデルと比較して、モデルサイズは約40%削減、計算量は約60%削減を実現した。