17日前

スピン重み付き球面CNN

Carlos Esteves, Ameesh Makadia, Kostas Daniilidis
スピン重み付き球面CNN
要約

等変表現(equivariant representations)を学習することは、深層ニューラルネットワークのサンプル量およびモデルの複雑性を低減し、一般化性能を向上させる有望なアプローチである。球面CNN(spherical CNNs)はその成功例であり、球面上の入力をSO(3)-等変表現として出力している。球面CNNには主に2種類のアーキテクチャがある。1つ目は、入力を回転群SO(3)上の関数にリフト(lift)し、群上での畳み込みを適用する方法である。しかし、SO(3)は1次元多いため、計算コストが高くなるという問題がある。2つ目は、球面上で直接畳み込みを適用する手法であり、これにはゾナル(等方的)なフィルタに限定されるため、表現力に限界がある。本論文では、球面領域から離れることなく、効率的に非等方的フィルタを扱える新しいタイプの球面CNNを提案する。本手法の鍵となるアイデアは、重力波の研究において導入されたスピン重み付き球面関数(spin-weighted spherical functions)を用いることである。これらは球面上で定義された複素数値関数であり、回転によって位相が変化する特徴を持つ。本研究では、スピン重み付き関数間の畳み込みを定義し、それを基盤とするCNNを構築した。また、スピン重み付き関数は球面上のベクトル場として解釈でき、入力または出力がベクトル場であるタスクへの応用が可能である。実験の結果、本手法は球面画像分類、3次元形状分類、球面パノラマのセマンティックセグメンテーションといったタスクにおいて、従来手法を上回る性能を示した。