2ヶ月前
MixMatch: 半教師付き学習の包括的アプローチ
David Berthelot; Nicholas Carlini; Ian Goodfellow; Nicolas Papernot; Avital Oliver; Colin Raffel

要約
半教師あり学習は、ラベルの付いていないデータを活用して大規模なラベル付きデータセットへの依存を軽減する強力なパラダイムであることが証明されています。本研究では、現在主流となっている半教師あり学習の手法を統合し、低エントロピーのラベルをデータ拡張された未ラベルサンプルに推定し、MixUp を使用してラベル付きデータと未ラベルデータを混合する新しいアルゴリズム MixMatch を提案します。我々は、MixMatch が多くのデータセットと異なる数のラベル付きデータで大幅に最先端の結果を得ることを示しています。例えば、CIFAR-10 において 250 のラベルを使用した場合、誤り率は約 4 倍(38% から 11%)改善され、STL-10 では約 2 倍の改善が見られました。また、差分プライバシーにおける精度とプライバシーのトレードオフが劇的に向上することも示しています。最後に、MixMatch の成功に最も重要なコンポーネントを特定するためにアブレーションスタディを行いました。注:「アブレーションスタディ」(ablation study)は一般的にはこのような訳が使用されます。