11日前
3Dインスタンスセグメンテーションにおいてトップダウンがボトムアップを上回る
Maksim Kolodiazhnyi, Anna Vorontsova, Anton Konushin, Danila Rukhovich

要約
多数の3Dインスタンスセグメンテーション手法は、リソースを大量に消費する後処理を伴うボトムアップ戦略を採用している。ポイントグループ化において、ボトムアップ手法は、ハイパーパラメータとしてオブジェクトに関する事前仮定に依存しており、これらはドメイン特有であり、慎重なチューニングが必要となる。これに対して、本研究では、初めてのクラスタフリーかつ完全畳み込み型、かつ完全にデータ駆動型のエンドツーエンド学習可能なアプローチ、TD3Dを提案する。これは、3D領域においてボトムアップ手法を上回る初のトップダウンアプローチである。シンプルなパイプラインを採用しており、標準的な屋内ベンチマークであるScanNet v2、その拡張版ScanNet200、S3DISに加え、航空画像用のSTPLS3Dデータセットにおいても、優れた精度と汎化性能を示した。さらに、現在の最先端のグループ化ベース手法と比較して、推論速度が大幅に向上している。当該手法の主力バージョンは、最も精度の高いボトムアップ手法よりも1.9倍高速でありながら、精度も上回る。また、より高速なバージョンでは、2.6倍の高速化を実現しつつ、最先端の精度を達成している。コードはGitHubにて公開されている:https://github.com/SamsungLabs/td3d。