13日前
ReMixMatch:分布整合と増強アンカーを用いた半教師付き学習
David Berthelot, Nicholas Carlini, Ekin D. Cubuk, Alex Kurakin, Kihyuk Sohn, Han Zhang, Colin Raffel

要約
最近提案された半教師付き学習アルゴリズム「MixMatch」を、2つの新技術——分布整合(distribution alignment)と増強アンカー(augmentation anchoring)——を導入することで改善した。分布整合は、未ラベルデータに対する予測の周辺分布が真のラベルの周辺分布に近づくように促す。増強アンカーは、同一入力の複数の強化されたバージョンをモデルに入力し、各出力がその入力の弱い増強バージョンに対する予測に近づくように促す。強化されたデータを生成するため、モデルの学習中に増強方針を学習するAutoAugmentの変種を提案した。本研究で提案する新しいアルゴリズム「ReMixMatch」は、従来手法に比べてデータ効率が著しく向上しており、同じ精度に達するためには、従来手法の5倍から16倍のデータ量で済む。例えば、CIFAR-10データセットにおいてラベル付きサンプルが250例のみの場合、93.73%の精度を達成した(MixMatchは4,000例のラベル付きデータを用いて93.58%の精度)。また、クラスあたり4例のラベルのみで、中央値として84.92%の精度を達成した。本研究のコードおよびデータは、https://github.com/google-research/remixmatch にてオープンソースとして公開している。