
要約
カプセルネットワークは、形状認識の難問において従来の手法を上回る性能を示した最近提案されたニューラルネットワークの一種です。カプセルネットワークでは、スカラーニューロンがカプセルベクトルまたは行列に置き換えられます。これらのエントリは物体の異なる特性を表します。物体とその部分との関係は、学習可能な視点不変変換行列を用いて学習され、特定の物体の存在はその部分からの投票の合意度によって決定されます。この相互作用はカプセル層間で起こり、合意によるルーティング(routing-by-agreement)というプロセスと呼ばれます。本論文では、変分ベイズ法を用いてガウシアン混合モデルへの適合を行う新しいカプセルルーティングアルゴリズムを提案し、これを用いてカプセルネットワークをCapsule-VAEに変換可能であることを示します。我々のベイズ的なアプローチは、カプセルポーズパラメータに対する不確実性をモデル化することで、最大尤度推定(MLE)に基づくモデルに内在する弱さ(例えば分散崩壊(variance-collapse))に対処します。我々はsmallNORBデータセットにおいて、以前報告されたものよりも50%少ないカプセルを使用して最先端の性能を達成し、CIFAR-10、Fashion-MNIST、SVHNにおいて競争力のある性能を達成しました。さらに、MNISTからaffNISTへの一般化能力においても前研究よりも大幅な改善を示しています。