11日前
LiDARデータ上の局所的ディープ暗黙関数を用いた意味的シーン補完
Christoph B. Rist, David Emmerichs, Markus Enzweiler, Dariu M. Gavrila

要約
意味的シーン補完(Semantic scene completion)とは、指定された範囲内における物体および表面の3次元幾何構造と意味情報を同時に推定するタスクである。このタスクは、点稀疏かつ遮蔽が生じやすい現実世界のデータにおいて特に困難である。本研究では、局所的な深層暗黙関数(local Deep Implicit Functions)を基盤とするシーンセグメンテーションネットワークを提案し、シーン補完のための新たな学習ベースの手法を構築した。従来のシーン補完手法とは異なり、本手法はボクセル化に基づかない連続的なシーン表現を生成する。入力となる生の点群データを、局所的にかつ複数の空間解像度で潜在空間(latent space)に符号化した後、その局所関数パッチを統合してグローバルなシーン補完関数を構築する。本研究では、この連続的表現が、空間離散化を必要とせずに、広大な屋外シーンの幾何学的および意味的特性を効果的に表現できることを示した(これにより、シーンの詳細度とカバー可能な範囲の間に生じるトレードオフを回避できる)。本手法は、Semantic KITTIデータセットから取得した意味ラベル付きLiDARスキャンデータを用いて訓練および評価を行った。実験結果から、本手法が高密度な3次元シーン記述に変換可能な強力な表現を生成できることを確認した。また、Semantic KITTI シーン補完ベンチマークにおける幾何学的補完の交差率(intersection-over-union, IoU)において、既存の最先端手法を上回る性能を達成した。