
要約
H3DNetは、カラーレスな3D点群を入力として受け取り、方向付きのオブジェクトバウンディングボックス(BB)およびそのセマンティックラベルの集合を出力するモデルを提案する。H3DNetの核心的なアイデアは、幾何学的プリミティブのハイブリッド集合、すなわちBBの中心、BBの面中心、BBの辺中心を予測することにある。本研究では、オブジェクトと幾何学的プリミティブの間の距離関数を定義することで、予測された幾何学的プリミティブからオブジェクト候補を生成する方法を示す。この距離関数により、オブジェクト候補の連続的な最適化が可能となり、局所最小値が高精度なオブジェクト候補を提供する。その後、H3DNetはマッチングおよび精調モジュールを用いて、オブジェクト候補を検出されたオブジェクトに分類し、検出されたオブジェクトの幾何パラメータを微調整する。ハイブリッドな幾何学的プリミティブの集合は、単一の幾何学的プリミティブのみを用いる場合よりもより正確な検出信号を提供するだけでなく、得られる3Dレイアウトに対して過剰な制約をもたらす。その結果、H3DNetは予測された幾何学的プリミティブに含まれる外れ値にも頑健である。本モデルは、実際の3Dスキャンデータを用いた2つの大規模データセット、ScanNetおよびSUN RGB-Dにおいて、最先端の3D検出性能を達成した。