13日前
PillarNeXt:LiDARポイントクラウドにおける3Dオブジェクト検出のためのネットワーク設計の再考
Jinyu Li, Chenxu Luo, Xiaodong Yang

要約
LiDARを用いた3Dオブジェクト検出の研究では、点群データが疎で構造化されていないという特性に対処するため、主に細粒度な幾何形状モデリングを実現するための専用の局所的点集約機構(local point aggregators)の設計に注力している。本論文では、計算リソースの配分という視点から、こうした局所的点集約機構を見直す。その結果、最も単純なピラミッド(pillar)ベースのモデルが、精度と遅延の両面において驚くほど優れた性能を発揮することが明らかになった。さらに、2Dオブジェクト検出の成功事例から得られた最小限の改良、たとえば受容 field の拡大といった手法が、性能向上に顕著な効果をもたらすことも示した。広範な実験により、アーキテクチャおよび学習戦略を現代化したピラミッドベースのネットワークが、代表的な2つのベンチマークであるWaymo Open DatasetおよびnuScenesにおいて、最先端の性能を達成することが確認された。これらの結果は、3Dオブジェクト検出において高い性能を達成するには詳細な幾何形状モデリングが不可欠であるという一般的な直感を疑問視するものである。