
要約
最近のいくつかの研究では、深層畳み込みニューラルネットワークによって生成された画像記述子が、画像分類や検索問題において最先端の性能を提供することを示しています。また、畳み込み層からの活性化が特定の画像領域を説明する局所特徴として解釈できることも明らかになっています。これらの局所特徴は、局所特徴用に開発された集約手法(例:Fisher ベクトル)を使用して集約され、新しい強力な全体的な記述子を提供します。本稿では、局所的な深層特徴を集約してコンパクトな全体的な記述子を作成するための方法について調査を行いました。まず、深層特徴と伝統的な手動で設計された特徴が対象間の類似度分布に大きな違いがあることを示しました。このため、既存の集約手法は慎重に再評価する必要があります。そのような再評価により、浅層特徴とは異なり、単純な和プーリングに基づく集約手法が深層畳み込み特徴に対して最良の性能を提供することが明らかになりました。この手法は効率的であり、パラメータが少なく、PCA 行列を学習する際などには過学習のリスクが少ないという利点があります。総じて、新しいコンパクトな全体的な記述子は4つの一般的なベンチマークにおいて大幅に最先端の性能を向上させています。