2ヶ月前

特定物体検索におけるCNN活性化の積分最大プーリング

Giorgos Tolias; Ronan Sicre; Hervé Jégou
特定物体検索におけるCNN活性化の積分最大プーリング
要約

最近、畳み込みニューラルネットワーク(CNN)に基づく画像表現が、短ベクトル表現としての事前CNN特徴を上回る効果的な記述子を提供することが示されています。しかし、これらのモデルは幾何学的に再順位付けを行う方法と互換性がなく、特定の物体検索ベンチマークでは、正確な記述子マッチング、幾何学的な再順位付け、またはクエリ拡張に依存する伝統的な画像検索システムによって依然として上回られています。本研究では、CNNから派生した同一の原始情報を用いて、初期検索と再順位付けという2つの検索段階を見直します。私たちはネットワークに複数の入力を供給することなく、複数の画像領域をエンコードするコンパクトな特徴ベクトルを構築します。さらに、積分画像を畳み込み層の活性化に対するmax-pooling処理に対応させることで、対象物体の効率的な局所化を可能にしました。最終的に得られたバウンディングボックスは画像の再順位付けに使用されます。その結果、本論文では既存のCNNベースの認識パイプラインを大幅に改善し、困難なOxford5kおよびParis6kデータセットにおいて伝統的方法と競合する初めての結果を報告しています。