17日前
Few-shot Image Recognitionのためのマルチレベルメトリック学習
Haoxing Chen, Huaxiong Li, Yaohui Li, Chunlin Chen

要約
少数回学習(few-shot learning)は、少数のサンプルに基づいてモデルを学習することを目的としている。多くの既存手法は、ピクセルレベルまたはグローバルレベルの特徴表現に基づいてモデルを学習する。しかし、グローバル特徴のみを用いる場合、局所的な情報を失う可能性があり、逆にピクセルレベルの特徴を用いる場合、画像の文脈的意味情報が損なわれる。さらに、これらの手法は特徴間の関係を単一のレベルでのみ評価するため、包括的かつ効果的な関係把握が困難である。一方で、クエリ画像がピクセルレベル、部分レベル、グローバルレベルの三つの異なるレベルの類似性メトリクスを同時に良好に満たす場合、同一クラス内のクエリ画像はより小さな特徴空間内でより緊密に分布し、より判別力の高い特徴マップを生成できる。この洞察に基づき、本研究ではタスク固有の特徴を生成するための新しい手法「部分レベル埋め込み適応グラフ法(Part-level Embedding Adaptation with Graph, PEAG)」を提案する。さらに、ピクセルレベルの類似性に加え、部分レベルおよびグローバルレベルの特徴の類似性も考慮する「多レベルメトリック学習法(Multi-level Metric Learning, MML)」を提案する。多数の代表的な少数回画像認識データセットにおける広範な実験により、本手法が最先端手法と比較して有効であることが実証された。本研究の実装コードは、\url{https://github.com/chenhaoxing/M2L} にて公開されている。