DAS:ディープメトリック学習を 위한密にアンカー化されたサンプリング

深層マトリクス学習(Deep Metric Learning, DML)は、意味的に類似したデータを埋め込み空間内で近接する位置に写像するための埋め込み関数を学習する手法であり、画像検索や顔認識など多くの応用分野において重要な役割を果たしている。しかし、DML手法の性能は、訓練過程において埋め込み空間から有効なデータを選択するサンプリング手法に大きく依存する。実際には、埋め込み空間内の埋め込みは深層モデルによって得られるが、学習データ点が存在しない領域(バリアン領域)が生じやすく、その結果、「埋め込みの欠落(missing embedding)」という問題が発生する。この問題はサンプルの質を低下させ、DMLの性能を劣化させる要因となる。本研究では、「埋め込みの欠落」問題を軽減し、サンプリングの質を向上させ、効果的なDMLを実現する方法を検討する。そのために、対応するデータ点を持つ埋め込みを「アンカー」と定義し、アンカー周辺の埋め込み空間を活用してデータ点のない領域にも密に埋め込みを生成する、Densely-Anchored Sampling(DAS)スキームを提案する。具体的には、単一のアンカー周辺では「判別的特徴スケーリング(Discriminative Feature Scaling, DFS)」を、複数のアンカーに対しては「記憶型変換シフト(Memorized Transformation Shifting, MTS)」を用いて、データ点のない領域の埋め込みを効果的に生成する。このように、データ点を有する埋め込みとない埋め込みを統合することで、サンプリングプロセスにより多くの埋め込みを提供可能となり、DMLの性能向上を実現する。本手法は既存のDMLフレームワークに容易に統合可能であり、追加的な構造や複雑な調整を必要とせずに性能を向上させる。3つのベンチマークデータセットにおける広範な実験により、本手法の優位性が実証された。