
要約
最近、畳み込みネットワーク技術は視覚に基づく検出タスクにおいて大きな成功を収めています。本論文では、当研究室の全畳み込みネットワーク技術を3次元レンジスキャンデータの検出タスクに移植した最近の研究成果について紹介します。特に、Velodyne 64E LiDARのレンジデータから車両を検出するシナリオを取り上げます。本研究では、データを2次元ポイントマップとして表現し、単一の2次元エンドツーエンド全畳み込みネットワークを使用して、物体存在確信度とバウンディングボックスを同時に予測することを提案しています。バウンディングボックスのエンコーディングを慎重に設計することで、2次元畳み込みネットワークを使用しても完全な3次元バウンディングボックスを予測することが可能となります。KITTIデータセットでの実験結果は、提案手法が最先端の性能を示していることを示しています。