17日前

PADS:視覚的類似性学習におけるポリシー適応型サンプリング

Karsten Roth, Timo Milbich, Björn Ommer
PADS:視覚的類似性学習におけるポリシー適応型サンプリング
要約

視覚的類似性の学習には、通常、画像の三つ組(トリプレット)間の関係性を学習する必要がある。たとえトリプレットに基づくアプローチが強力であるものの、その計算量の高さから、すべての可能な訓練用トリプレットのうち一部に限定して学習が行われる。そのため、学習中にどの訓練サンプルをいつ使用するかを決定するサンプリング戦略は極めて重要である。現在の主流は、学習開始前に事前に定義された固定またはカリキュラムベースのサンプリング戦略であるが、実際のところ、学習中に視覚的類似性表現の状態に応じて動的に調整可能なサンプリングプロセスが求められている。そこで本研究では強化学習を採用し、教師ネットワークが学習者ネットワーク(視覚的類似性を表現する)の現在の状態に基づいてサンプリング分布を調整するアプローチを提案する。標準的なトリプレットベースの損失関数を用いたベンチマークデータセット上の実験により、本手法の適応的サンプリング戦略が固定型サンプリング戦略を顕著に上回ることが示された。さらに、本手法は基本的なトリプレット学習フレームワークの上にのみ適用されているにもかかわらず、多様な追加学習信号や強力なアンサンブルアーキテクチャを用いる最先端手法と比較しても競争力のある結果を達成している。コードは以下のURLで公開されている:https://github.com/Confusezius/CVPR2020_PADS。

PADS:視覚的類似性学習におけるポリシー適応型サンプリング | 最新論文 | HyperAI超神経