要約
少数ショット視覚認識は、ベースクラスから汎化可能な事前知識を学習しつつ、ラベルが極めて少ない状況で未観測の新しいクラスを識別することを目的とする。近年の研究では、ベースクラスに一切のラベルを用いない非教師あり設定でこの問題に取り組むアプローチが提案されており、手動によるアノテーションの大量消費を軽減する効果がある。本論文では、自己教師あり学習の知見に基づき、少数ショットタスクに適した新しい非教師あり学習手法を提案する。この手法は、不変性(Invariant)と一貫性(Consistent)を統合する「InCo(Invariant and Consistent)表現」を共同で学習するものである。不変性表現の構築のために、各インスタンスの回転予測を構成する幾何学的不変性モジュールを提案する。このモジュールはインスタンス内での変動性を学習し、特徴の識別力を向上させる。さらに、インスタンス間の一貫性表現を強化するため、二つの対比学習アプローチからなるペアワイズ一貫性モジュールを導入する。一つは履歴学習キューを用いた包括的対比学習であり、もう一つは現在の学習サンプルの表現を強化する局所的対比学習である。また、特徴間の対比学習をより効果的に実現するため、非対称な畳み込みアーキテクチャを導入し、高品質な表現をエンコードする。4つの公開ベンチマークにおける包括的な実験により、本手法の有効性と従来手法に対する優位性が確認された。