
要約
カプセルおよびそれらの間の動的ルーティングは、最近提唱された深層ニューラルネットワークの構造です。カプセルは、対象インスタンスの特定の特性を表現するために、従来のスカラーではなく、ベクトルや行列としてデータをポーズにグループ化します。ポーズに加えて、カプセルにはその存在確率(通常活性化と表記される)が付与されるべきです。動的ルーティングは、多くのモデルパラメータを使用せずに、カプセルがより一般的な汎化能力を持つことを可能にします。しかし、カプセルの普及を妨げるボトルネックは、ルーティング中の計算コストの高さです。この問題に対処するため、既存のルーティング方法を重み付きカーネルドENSITY推定(weighted kernel density estimation)の枠組み内で一般化し、異なる最適化戦略に基づく2つの高速ルーティング方法を提案しました。これらの方法により、性能低下をほとんど引き起こすことなく、ルーティングの時間効率が約40%向上しました。畳み込み層とカプセル層のハイブリッドを積み重ねることで、$64\times{64}$ピクセル解像度での入力を処理できるネットワークアーキテクチャを構築しました。提案したモデルは複数のベンチマークにおいて他の最先端手法と同等以上の性能を達成しています。