8日前

特徴依存型ラベルノイズを用いた学習:プログレッシブアプローチ

Yikai Zhang, Songzhu Zheng, Pengxiang Wu, Mayank Goswami, Chao Chen
特徴依存型ラベルノイズを用いた学習:プログレッシブアプローチ
要約

現実世界の大規模データセットにおいて、ラベルノイズは頻繁に観察される。このノイズは多様な要因によって生じ、非一様かつ特徴量依存性を示す。従来のラベルノイズ対処手法は、主に二つのアプローチに分類される。一つは理想的な特徴量に依存しないノイズを仮定するものであり、もう一つは理論的保証を持たないヒューリスティックな手法である。本論文では、従来のi.i.d.ラベルノイズよりもはるかに一般的であり、広範なノイズパターンを包含する、新たな特徴量依存型ラベルノイズのクラスに注目する。この一般的なノイズクラスに焦点を当て、ラベルを段階的に修正し、モデルを逐次精緻化するプログレッシブラベル補正アルゴリズムを提案する。理論的に、さまざまな(未知の)ノイズパターンに対して、本戦略で訓練された分類器がベイズ分類器と一貫性を持つよう収束することを保証する。実験結果において、本手法は最先端(SOTA)のベースラインを上回り、多様なノイズ種類およびノイズレベルに対して堅牢であることが示された。