
要約
距離メトリック学習(DML)の問題に着目し、画像間の有効な類似度測度を学習するタスクを扱う。本研究では、ProxyNCAを再検討した上で、複数の改良を導入する。まず、低温度スケーリング(low temperature scaling)が性能に重大な影響を与える重要な要素であることを発見し、その効果の理由を解明した。また、グローバルマックスプーリング(Global Max Pooling)がグローバル平均プーリング(Global Average Pooling)よりも一般的に優れた性能を発揮することも明らかにした。さらに、提案する「高速移動プロキシ(fast moving proxies)」は、プロキシの勾配が小さい問題を緩和する効果があり、低温度スケーリングおよびグローバルマックスプーリングと良好な相性を示す。これらの改良を統合した拡張モデル「ProxyNCA++」は、オリジナルのProxyNCAアルゴリズムと比較して、4つの異なるゼロショットリトリーバルデータセットにおいて平均Recall@1が22.9ポイント向上した。さらに、CUB200、Cars196、Sop、InShopの各データセットにおいて、それぞれRecall@1が72.2、90.1、81.4、90.9という最先端(state-of-the-art)の成果を達成した。