SimMatch:類似性マッチングを用いた教師付き学習

ラベル付きデータが少ない状況での学習は、コンピュータビジョンおよび機械学習分野において長年にわたり重要な課題として扱われてきました。本論文では、意味的類似性(semantic similarity)とインスタンスレベルの類似性(instance similarity)の両方を同時に考慮する新しい半教師あり学習フレームワーク、SimMatchを提案します。SimMatchでは、クラス予測の一貫性正則化(consistency regularization)を意味的レベルおよびインスタンスレベルの両方に対して適用します。同一インスタンスの異なる増強画像(augmented views)は、同じクラス予測を出力することを促進するとともに、他のインスタンスとの類似性関係も一致させるよう設計されています。さらに、インスタンスレベルにおける真のラベルを効果的に活用するため、ラベル付きメモリバッファを導入し、意味的類似性とインスタンス類似性の間のギャップを埋めることを可能にしました。最後に、これらの二つの類似性を互いに同型(isomorphic)に変換できる「展開(unfolding)」および「集約(aggregation)」演算を提案しました。これにより、意味的およびインスタンスレベルの偽ラベル(pseudo-label)が相互に伝搬し合い、より高品質で信頼性の高いマッチングターゲットを生成することが可能になります。広範な実験結果から、SimMatchがさまざまなベンチマークデータセットおよび異なる設定において、半教師あり学習タスクの性能を向上させることを確認しました。特に、ImageNetにおいて1%および10%のラベル付きサンプルを用いた場合、400エポックの学習でそれぞれ67.2%および74.4%のTop-1精度を達成し、ベースライン手法を顕著に上回り、従来の半教師あり学習フレームワークよりも優れた性能を示しました。コードおよび事前学習済みモデルは、https://github.com/KyleZheng1997/simmatch にて公開されています。