2ヶ月前

カプセル間の動的ルーティング

Sara Sabour; Nicholas Frosst; Geoffrey E Hinton
カプセル間の動的ルーティング
要約

カプセルは、特定のエンティティ(オブジェクトやオブジェクトの一部など)のインスタンス化パラメータを表す活動ベクトルを持つ一群のニューロンです。我々は、活動ベクトルの長さをそのエンティティが存在する確率を表し、ベクトルの向きをインスタンス化パラメータを表すために使用します。あるレベルでの活性化カプセルは、変換行列を通じて上位レベルのカプセルのインスタンス化パラメータに対する予測を行います。複数の予測が一致した場合、上位レベルのカプセルが活性化されます。我々は、識別的に訓練された多層カプセルシステムがMNISTで最先端の性能を達成し、高密度に重なる数字の認識において畳み込みネットワークよりも著しく優れていることを示しました。これらの結果を得るためには、反復的な合意によるルーティング機構を使用しています:下位レベルのカプセルは、その出力を上位レベルのカプセルへ送ることを好む傾向があり、これは下位レベルから来る予測と大きなスカラー積を持つ活動ベクトルを持つ上位レベルのカプセルに対して言えます。