8日前

画像とそのクリーンなラベルおよびノイズのあるラベルの関係をブートストラップする

Brandon Smart, Gustavo Carneiro
画像とそのクリーンなラベルおよびノイズのあるラベルの関係をブートストラップする
要約

最新のノイズラベル学習手法の多くは、学習中にサンプルのクリーンラベルを推定し、元のノイズラベルを棄却する学習メカニズムに依存している。しかし、このアプローチでは、画像、ノイズラベル、およびクリーンラベルの間の関係を学習できず、特にインスタンス依存型ラベルノイズ問題に対処する際に有用であることが示されている関係性を捉えることができない。さらに、この関係性を学ぼうとする手法は、データのクリーンラベル付きサブセットを必要とし、また、知識蒸留(distillation)やマルチフェイズモデル(multi-faceted models)を用いた訓練を要する場合が多い。本論文では、クリーンラベル付きサブセットを必要とせず、シンプルなモデルを用いてクリーンラベルとノイズラベルの関係を学習する新しい訓練アルゴリズムを提案する。本アルゴリズムは以下の3段階プロセスに従う:1)自己教師学習による事前学習の後、分類器を早期停止(early-stopping)で訓練し、学習セットの一部に対して信頼性の高いクリーンラベルを予測する;2)段階(1)で得られたクリーンセットを用いて、画像、ノイズラベル、クリーンラベルの関係をブートストラップし、これを半教師あり学習を用いて残りの学習セットに対する効果的な再ラベリングに活用する;3)段階(2)で再ラベリングされたすべてのサンプルを用いて、分類器を教師あり学習で再訓練する。この関係性を学習することで、非対称的かつインスタンス依存型のラベルノイズ問題において、最先端の性能を達成した。