17日前

PropMix:ノイズラベル学習のためのハードサンプルフィルタリングと比例混合アップ

Filipe R. Cordeiro, Vasileios Belagiannis, Ian Reid, Gustavo Carneiro
PropMix:ノイズラベル学習のためのハードサンプルフィルタリングと比例混合アップ
要約

最も競争力のあるノイズラベル学習手法は、クリーンサンプルとノイズを含むサンプルを無監督で分類し、ノイズと分類されたサンプルを再ラベル化してクリーンサンプルと「MixMatch」するというアプローチに依拠している。しかし、これらの手法は高ノイズ率の状況下で2つの問題を抱えている。第一に、ノイズサンプル集合には誤って再ラベル化されやすい難易度の高いサンプルが含まれる可能性が高くなること。第二に、MixMatchによって生成されるサンプル数が、クリーンサンプル数が少ないという制約により減少してしまうことである。本論文では、上記の問題に対処するための学習アルゴリズム「PropMix」を提案する。PropMixは、難易度の高いノイズサンプルをフィルタリングすることで、容易なノイズサンプルの再ラベル化が正しく行われる確率を高める。さらに、PropMixはクリーンサンプルと再ラベル化された容易なノイズサンプルを、MixUpによって拡張された訓練セットに統合する。これにより、クリーンサンプル数の制約が解消され、正しく再ラベル化された容易なノイズサンプルの割合を大幅に増加できる。また、高ノイズラベル環境に対する耐性を向上させるために自己教師付き事前学習を導入している。実験の結果、PropMixはCIFAR-10/100(対称的・非対称的・意味的ラベルノイズを含む)、Red Mini-ImageNet(Controlled Noisy Web Labelsより取得)、Clothing1M、WebVisionにおいて、既存手法を上回る最先端(SOTA)の性能を達成した。特に、重度のラベルノイズを伴うベンチマークにおいて、他の手法と比較して顕著な優位性を示した。実装コードは、https://github.com/filipe-research/PropMix にて公開されている。

PropMix:ノイズラベル学習のためのハードサンプルフィルタリングと比例混合アップ | 最新論文 | HyperAI超神経