
最近の研究では、明示的な深層特徴マッチングや大規模かつ多様な訓練データが、個人再識別の汎化性能を大幅に向上させることを示しています。しかし、大規模データでの深層マッチャーの学習効率についてはまだ十分に研究されていません。分類パラメータやクラスメモリを使用した学習は一般的ですが、これらは大きなメモリと計算コストを伴います。一方で、ミニバッチ内のペアワイズ深層計量学習の方がより良い選択肢となる可能性があります。しかし、最も一般的なランダムサンプリング法であるPKサンプラーは、深層計量学習において情報量が少なく効率的ではないという問題があります。オンラインハード例マイニングは学習効率を一定程度改善しましたが、ランダムサンプリング後のミニバッチでのマイニングには依然として制限があります。この課題から我々は、データサンプリング段階でハード例マイニングを行うことの有用性を探求することにしました。本論文では、大規模深層計量学習向けの効率的なミニバッチサンプリング方法として、「グラフサンプリング(GS)」を提案します。基本的なアイデアは、各エポックの開始時にすべてのクラス間で最近傍関係グラフを構築することです。その後、各ミニバッチはランダムに選択されたクラスとその最近傍のクラスから構成され、学習に有益かつ挑戦的な例を提供します。適応型競合基準と共に使用することで、MSMT17データセット上でRandPersonで訓練した場合のRank-1精度において25.1%向上し、汎化可能な個人再識別における最先端技術を大幅に改善しました。さらに提案手法はCUHK03-NPデータセットでも競合基準を超える性能を発揮し、MSMT17で訓練した場合のRank-1精度において6.8%向上しました。同時に、8,000人のアイデンティティを持つRandPersonで訓練する際にはトレーニング時間も大幅に短縮され、25.4時間から2時間へと削減されました。コードは以下のURLから入手可能です: https://github.com/ShengcaiLiao/QAConv.