17日前
画像検索におけるロバストかつ分解可能な平均精度
Elias Ramzi, Nicolas Thome, Clément Rambour, Nicolas Audebert, Xavier Bitot

要約
画像検索において、標準的な評価指標はスコアの順位付けに依存しており、例えば平均精度(AP)が代表的である。本論文では、APを用いた深層ニューラルネットワークのエンドツーエンド学習における2つの主要な課題、すなわち非微分性と非分解性に対処する、ロバストかつ分解可能な平均精度(ROADMAP)という新しい手法を提案する。まず、ランク関数に対する新しい微分可能な近似を提案し、これはAP損失の上界を提供することで、安定した学習を保証する。次に、全体の訓練データにおけるAPとそのバッチ平均近似との間の分解性ギャップを低減するため、シンプルでありながら効果的な損失関数を設計した。これに関しては理論的な保証も提示する。3つの画像検索データセットを用いた広範な実験により、ROADMAPは近年提案された複数のAP近似手法を上回ることを示し、本研究の2つの貢献の重要性を強調している。最終的に、ROADMAPを用いて深層モデルを学習することで、3つのデータセットにおいて最先端の成果を上回る優れた性能が得られた。