2ヶ月前

反復多様体埋め込み層の学習:大規模画像検索における不完全データを用いて

Jian Xu; Chunheng Wang; Chengzuo Qi; Cunzhao Shi; Baihua Xiao
反復多様体埋め込み層の学習:大規模画像検索における不完全データを用いて
要約

既存の多様体学習手法は画像検索タスクには適していない、なぜならそれらの多くがクエリ画像を処理できず、特に大規模データベースでは追加の計算コストが大きすぎるからである。そこで、我々は非監督戦略によってオフラインで重みを学習する反復多様体埋め込み(Iterative Manifold Embedding: IME)層を提案し、不完全なデータから内在的な多様体を探求することを目指す。27,000枚の画像を含む大規模データベースにおいて、IME層は他の多様体学習手法よりもクエリ時の元の表現を埋め込む速度が120倍以上速い。オフライン学習段階では、高次元空間に存在するデータベース画像の元の記述子を反復的に多様体に基づく表現に埋め込むことでIME表現を生成する。データベース画像の元の記述子とIME表現に基づいて、リッジ回帰を使用してIME層の重みを推定する。オンライン検索段階では、IME層を使用してクエリ画像の元の表現を無視できる時間コスト(2ミリ秒)でマッピングする。我々は5つの公開標準データセットで画像検索に関する実験を行い、提案されたIME層は関連する次元削減手法や多様体学習手法に対して著しく優れた性能を示した。ポストプロセッシングなしで、我々のIME層はほとんどのデータセットにおいてポストプロセッシング付きの最先端画像検索手法よりも性能が向上し、さらに少ない計算コストが必要である。