12日前
ポイントクラウド上の3Dオブジェクト検出のための階層的グラフネットワーク
{ Jian Wu, Danny Z. Chen, Haochao Ying, Qingyu Song, Biwen Lei, Jintai Chen}

要約
点群における3次元オブジェクト検出は、多岐にわたる応用が期待されている。しかし、既存の点群オブジェクト検出手法の多くは、点群が持つ特徴(例:疎性)を十分に反映できず、結果として重要な意味情報(例:形状情報)が適切に捉えられていない。本論文では、原始的な点群を直接処理し、3次元バウンディングボックスを予測する新しいグラフ畳み込み(GConv)に基づく階層的グラフネットワーク(HGNet)を提案する。HGNetは点間の関係性を効果的に捉え、多段階の意味情報を活用してオブジェクト検出を行う。特に、点の相対的な幾何的位置関係をモデル化することで、局所的な形状特徴を捉える新しい形状注意型GConv(SA-GConv)を提案する。SA-GConvを基盤とするU字型ネットワークにより、多段階の特徴を抽出し、改良された投票モジュールによって同一の特徴空間にマッピングされた後、提案領域(proposal)の生成に活用される。次に、新たなGConvに基づくProposal推論モジュールが、グローバルなシーンの意味情報を考慮して提案領域を推論し、最終的にバウンディングボックスを予測する。結果として、本研究で提案するフレームワークは、2つの大規模な点群データセットにおいて、SUN RGB-DではmAP(平均精度平均)で4%、ScanNet-V2では3%の向上を達成し、最先端の手法を上回る性能を発揮した。