
要約
正確な3次元物体検出(3DOD)は、自律ロボットが複雑な環境を安全に航行する上で不可欠である。特に、スパースなLiDARデータに基づいて雑然とした環境で正確な3次元バウンディングボックスを回帰することは、極めて困難な課題である。本研究では、確率的回帰に向けた条件付きエネルギー関数モデル(EBM)の最新の進展を活用することで、この課題に取り組む。これまでEBMを用いた回帰手法は、画像内の2次元物体検出において優れた性能を示しているが、これらは直接的に3次元バウンディングボックスに適用できるものではない。本研究では、この問題に対処するため、3次元バウンディングボックス用の微分可能なプーリング演算子を新たに設計し、EBMネットワークのコアモジュールとして構築した。さらに、この汎用的手法を最先端の3D物体検出器SA-SSDに統合した。KITTIデータセットにおける実験結果から、本研究で提案する手法は、すべての3DOD評価指標においてSA-SSDベースラインを一貫して上回り、EBMに基づく回帰が高精度な3DOD実現に有効であることを示した。実装コードは、https://github.com/fregu856/ebms_3dod にて公開されている。