
要約
半教師あり学習は、ラベル付きデータへの依存を軽減するためにラベルなしデータを効果的に活用するパラダイムとして広く用いられている。本研究では、既存の主流的手法を統合し、それらの限界を克服する新しい半教師あり学習手法であるCoMatchを提案する。CoMatchは、学習データの二つの表現——クラス確率と低次元埋め込み——を同時に学習する。これらの二つの表現は相互に作用しながら共同で進化する。埋め込みはクラス確率に対して平滑性制約を課し、擬似ラベルの品質を向上させる一方で、擬似ラベルはグラフベースの対照学習を通じて埋め込みの構造を正則化する。CoMatchは複数のデータセットにおいて最先端の性能を達成しており、ラベルが極めて限られたCIFAR-10およびSTL-10において顕著な精度向上を実現した。また、ImageNetにおいて1%のラベルのみを用いた場合、トップ1精度が66.0%に達し、FixMatchを12.6%上回った。さらに、下流タスクにおける表現学習性能においても、従来の教師あり学習および自己教師あり学習を上回る成果を示した。コードおよび事前学習済みモデルは、https://github.com/salesforce/CoMatch にて公開されている。