11日前
ISBNet:インスタンス認識サンプリングおよびボックス認識ダイナミック畳み込みを備えた3次元ポイントクラウドインスタンスセグメンテーションネットワーク
Tuan Duc Ngo, Binh-Son Hua, Khoi Nguyen

要約
既存の3Dインスタンスセグメンテーション手法は、主にボトムアップ設計に基づいている。すなわち、手動で調整されたアルゴリズムにより点群をクラスタにグループ化し、その後にリファインメントネットワークを適用する方式である。しかし、このようなアプローチはクラスタの品質に依存するため、(1)同じセマンティッククラスに属する近接する物体が密集している場合、あるいは(2)領域が緩く接合された大規模な物体に対して、脆弱な結果を生じる傾向がある。これらの課題を解決するために、本研究ではクラスタに依存しない新規な手法ISBNetを提案する。ISBNetはインスタンスをカーネルとして表現し、動的畳み込み(dynamic convolution)を用いてインスタンスマスクをデコードする。高再現率かつ識別性の高いカーネルを効率的に生成するため、候補点をサンプリングするためのシンプルな戦略である「インスタンス認識型最遠点サンプリング(Instance-aware Farthest Point Sampling)」を提案するとともに、PointNet++に着想を得た局所集約層を用いて候補の特徴を符号化する。さらに、動的畳み込み内で3D軸直交バウンディングボックスを予測・活用することで、性能のさらなる向上を示した。本手法は、ScanNetV2(AP: 55.9)、S3DIS(AP: 60.8)、STPLS3D(AP: 49.2)において、既存の最先端性能を更新し、ScanNetV2における1シーンあたりの推論時間は237msと高速な実行を維持している。ソースコードおよび学習済みモデルは、https://github.com/VinAIResearch/ISBNet にて公開されている。