17日前

分割に基づくメッシュ畳み込みネットワーク

Shi-Min Hu, Zheng-Ning Liu, Meng-Hao Guo, Jun-Xiong Cai, Jiahui Huang, Tai-Jiang Mu, Ralph R. Martin
分割に基づくメッシュ畳み込みネットワーク
要約

2次元コンピュータビジョン分野において、畳み込みニューラルネットワーク(CNN)は大きな飛躍を遂げてきた。しかし、その不規則な構造のため、メッシュ上にCNNの潜在能力を直接活用することは困難である。一方、サブディビジョンサーフェスは、階層的かつ多解像度構造を提供しており、閉じた2次元多面体三角メッシュにおける各面は、正確に3つの隣接面と接している。このような2つの観察に着目し、本稿ではLoopサブディビジョンシーケンス接続を持つ3次元三角メッシュ向けに、革新的かつ汎用性の高いCNNフレームワーク「SubdivNet」を提案する。メッシュの面を2次元画像のピクセルに類比することで、近接する面からの局所的特徴を統合するメッシュ畳み込み演算子を定義した。面の近傍構造を活用することで、変動するカーネルサイズ、ストライド、拡張(dilation)といった標準的な2次元CNNの概念を実現可能にする。さらに、多解像度階層構造を活かし、4つの面を均一に統合するプーリング層と、1つの面を4つに分割するアップサンプリング手法を導入した。これにより、多くの代表的な2次元CNNアーキテクチャを3次元メッシュ処理に容易に適応できる。任意の接続性を持つメッシュは、自己パラメータ化によりLoopサブディビジョンシーケンス接続に再メッシュ化可能であり、SubdivNetは汎用的な手法である。広範な評価および多様な応用により、SubdivNetの有効性と効率性が実証された。