8日前

SELFIE:ロバストなディープラーニングのための不純なサンプルのリニューアル

{Jae-Gil Lee, Minseok Kim, Hwanjun Song}
SELFIE:ロバストなディープラーニングのための不純なサンプルのリニューアル
要約

深層ニューラルネットワークの極めて高い表現力の一方で、ラベルが極めてノイズ混じりであっても、訓練データを完全に記憶してしまうという副作用が生じる。ノイズ混じりのラベルに対する過学習を克服するため、本研究では新しいロバストな学習手法であるSELFIEを提案する。本手法の核心的なアイデアは、高精度で修正可能な不純なサンプルを選択的に再構成・活用することで、段階的に利用可能な訓練サンプル数を増加させることにある。この設計により、誤った修正によるノイズ蓄積のリスクを効果的に防止しつつ、訓練データの潜在的な価値を最大限に引き出すことが可能となる。SELFIEの優位性を検証するため、4つの実世界または合成データセットを用いて広範な実験を実施した。その結果、2つの最先端手法と比較して、SELFIEはテスト誤差を顕著に低減することが明らかになった。