11日前
半教師あり学習における確実性の向上のためのクラス空間の縮小
Lihe Yang, Zhen Zhao, Lei Qi, Yu Qiao, Yinghuan Shi, Hengshuang Zhao

要約
半教師あり学習は、ラベルの付いていないデータを有効に活用する点で成功を収めたことから、注目を集めている。近年のフレームワークでは、誤った擬似ラベルのリスクを軽減するため、不確実なサンプルを除外するために固定された信頼度閾値を設定する手法が主流である。このアプローチは高品質な擬似ラベルを確保する一方で、ラベルなしデータセット全体の利用効率が相対的に低くなるという課題を抱えている。本研究における鍵となる洞察は、トップ1クラスに対する混同クラス(confusion classes)を検出し除去すれば、不確実なサンプルを確実なサンプルに変換可能であるということである。この知見を基に、不確実サンプルを学習するための新規手法「ShrinkMatch」を提案する。各不確実サンプルに対して、元のトップ1クラスに加え、確率が低い残りのクラスのみを含む縮小されたクラス空間(shrunk class space)を適応的に探索する。この空間では混同クラスが排除されているため、再計算されたトップ1クラスの信頼度が事前に定義された閾値を満たすようになる。その後、この縮小空間内で強化された増強サンプルと弱化された増強サンプルのペアに対して一貫性正則化(consistency regularization)を適用し、判別性の高い表現を学習することを目指す。さらに、不確実サンプル間での信頼度のばらつきおよび学習過程におけるモデルの段階的改善を考慮し、不確実損失に対して2つの再重み付け原理を設計した。本手法は広く採用されているベンチマークにおいて優れた性能を示した。コードは以下のURLから入手可能である:https://github.com/LiheYoung/ShrinkMatch。