
本論文では、形状グラフとして表現される3Dモデルの意味注釈の問題を研究しています。グラフ上の局所情報を表現するために機能的な視点を取り入れ、部品セグメントやキーポイントなどの注釈は0-1インジケータ頂点関数として扱われます。画像が2Dグリッドであるのに対し、形状グラフは不規則で非同型のデータ構造です。これらの頂点関数を畳み込みニューラルネットワーク(CNN)によって予測可能にするためには、グラフラプラシアン固有基底によって展開されるスペクトル領域でのカーネルパラメータ化を用いたスペクトルCNN法に頼らざるを得ません。この設定のもとで、我々のネットワークSyncSpecCNNは2つの主要な課題に取り組んでいます:単一形状内の異なる部分で係数共有と多尺度解析を行う方法、および非常に異なるグラフで表現される可能性のある関連する形状間での情報共有を行う方法です。これらの目標に向けて、我々はスペクトルパラメータ化された拡張畳み込みカーネルとスペクトルトランスフォーマー・ネットワークを導入しました。実験的には、SyncSpecCNNを3D形状部品セグメンテーションや3Dキーポイント予測など様々なタスクに対して評価しました。その結果、すべてのベンチマークデータセットにおいて最先端の性能が達成されました。科技/学术术语处理:- 畳み込みニューラルネットワーク (Convolutional Neural Networks)- グラフラプラシアン固有基底 (graph Laplacian eigenbases)- スペクトルCNN法 (spectral CNN method)- 部品セグメント (part segment)- キーポイント (keypoint)- ベンチマークデータセット (benchmark datasets)