2ヶ月前

グローバルプロキシベースのハードマイニングによる視覚的場所認識

Ali-bey, Amar ; Chaib-draa, Brahim ; Giguère, Philippe
グローバルプロキシベースのハードマイニングによる視覚的場所認識
要約

視覚的な場所認識のための深層表現を学習する際には、通常、各訓練イテレーションでサンプリングされた例の難易度に大きく依存するペアワイズまたはトリプレット損失関数を使用します。既存の手法では、この問題に対処するために、各イテレーションで訓練セットから最も難しいサンプルを識別するオフラインでのハードマイニングという計算量とメモリ消費が大きい方法が用いられています。本論文では、プロキシに基づくグローバルなハードミニバッチサンプリングを行う新しい手法を提案します。これにより、ネットワークに新たなエンドツーエンドで学習可能なブランチを追加し、効率的な場所記述子(各場所に対して1つのプロキシ)を生成します。これらのプロキシ表現は、データセット内のすべての場所間の類似性を包含するグローバルなインデックスを作成するために使用され、各訓練イテレーションで非常に情報量の高いミニバッチサンプリングが可能になります。当手法は、既存のすべてのペアワイズおよびトリプレット損失関数と組み合わせて使用でき、追加のメモリや計算コストはほとんどかかりません。我々は広範な削減研究を行い、Pittsburgh, Mapillary-SLS, SPEDなどの大規模ベンチマークにおいて当手法が新たな最先端性能を達成することを示しました。特に、困難なNordlandデータセットでは相対的に100%以上の改善が見られました。当コードはhttps://github.com/amaralibey/GPM で公開されています。注:「削減研究」は一般的には「アブレーションスタディ」(ablation study)と訳されることが多いですが、「削減」という言葉も使われることがあるため、ここでは「削減研究」と訳しました。ただし、「アブレーションスタディ」の方がより一般的かつ正確な訳語であることをご了承ください。