2ヶ月前
Vote3Deep: 3次元点群における高速物体検出を実現する効率的な畳み込みニューラルネットワークの利用
Martin Engelcke; Dushyant Rao; Dominic Zeng Wang; Chi Hay Tong; Ingmar Posner

要約
本論文では、3次元点群データにおいて物体を直接検出するための計算効率の高い手法を提案します。特に、この手法は特徴量中心の投票スキームを活用することで、入力データに見られる疎性を明示的に利用する新しい畳み込み層を実装しています。この目的のために、異なるアーキテクチャ間での精度と速度のトレードオフを検討し、さらに中間表現における疎性を促進するためにフィルタ活性化に対するL1ペナルティの使用を提案しています。当方の知る限り、これは大規模な3次元データ処理に向けた疎な畳み込み層とL1正則化を初めて提案した研究です。我々は、KITTI物体検出ベンチマークにおいて本手法の有効性を示し、Vote3Deepモデルが3層という少ない層数でレーザーおよびレーザービジョンベースの手法における従来の最先端技術に対して最大40%の性能向上を達成しつつ、処理時間においても非常に競争力があることを示しています。