
要約
深層計量学習は、画像のピクセルを埋め込み特徴ベクトルにマッピングする関数を学習することを目指しており、このベクトルは画像間の類似性をモデル化します。計量学習の主要な応用分野には、コンテンツベースの画像検索と顔認証があります。検索タスクにおいては、現行の最先端(SOTA)アプローチの多くが三重項ベースの非パラメトリック訓練を使用しています。一方、顔認証タスクでは最近のSOTAアプローチが分類ベースのパラメトリック訓練を採用しています。本論文では、分類ベースアプローチが画像検索データセットでの有効性について調査します。CAR-196、CUB-200-2011、Stanford Online Product、In-Shopなどの標準的な検索データセットで評価を行い、異なる特徴次元や基本特徴ネットワークにおいて当社の分類ベースアプローチが競争力があることを確認しました。さらに、スケーラブルな分類ベース訓練のためにクラスをサブサンプリングした際の性能影響について考察し、実用的なアプリケーションにおける効率的な保存と計算を可能にするバイナリ化の効果も分析します。