
要約
現在の3Dセンサの重要性を踏まえ、基本的な点群データに対する細粒度な分析はさらなる調査の価値がある。特に、実際の点群シーンは現実世界の複雑な環境を直感的に捉えることができるが、3Dデータの原始的な性質から、機械による認識には極めて高い課題が伴う。本研究では、現実世界で収集された大規模な点群データに対して、基本的な視覚タスクであるセマンティックセグメンテーションに焦点を当てる。一方で、近接する点間の曖昧さを低減するため、双方向構造を活用して幾何学的特徴とセマンティック特徴を包括的に活用し、局所的な文脈を拡張する。他方で、点の特徴の明確さを複数の解像度から包括的に解釈し、点レベルで適応的融合手法を用いて特徴マップを表現することで、高精度なセマンティックセグメンテーションを実現する。さらに、キーモジュールの有効性を検証するための具体的なアブレーションスタディおよび直感的な可視化を提供する。3つの異なるベンチマーク上で最先端のネットワークと比較することで、本ネットワークの有効性を実証する。