
要約
ポイントクラウドのセマンティックセグメンテーションにおいて、標準的な畳み込みは特徴量に関する等方性(isotropy)という本質的な制約を持つため、物体の構造を無視してしまう。その結果、物体の輪郭が不鮮明になり、セグメンテーション結果に小さな誤検出領域が生じる問題が発生する。本論文では、物体の構造に適応するため、カーネル形状を動的に調整可能な新しいグラフアテンション畳み込み(Graph Attention Convolution: GAC)を提案する。具体的には、隣接する点群に対して適切なアテンション重みを割り当てることで、動的に学習された特徴に基づいて最も関連性の高い部分に焦点を当てるように設計されている。このアテンション重みの学習された分布に基づき、畳み込みカーネルの形状が決定される。シンプルながらも、GACはポイントクラウドの構造的特徴を効果的に捉え、物体間の特徴の混入(feature contamination)を回避し、細粒度なセグメンテーションを実現できる。理論的には、GACの表現能力について包括的な分析を行い、ポイントクラウドの特徴をどのように学習可能であるかを示した。実証的にも、困難な屋内および屋外データセット上で本手法を評価し、いずれのシナリオにおいても最先端の性能を達成した。