17日前
ノイズ付きラベルにおける学習のためのFINEサンプル
Taehyeon Kim, Jongwoo Ko, Sangwook Cho, Jinhwan Choi, Se-Young Yun

要約
現代の深層ニューラルネットワーク(DNN)は、データセットにノイズ(誤った)ラベルを含む場合、脆弱性を示す傾向がある。ノイズラベルに強い耐性を持つ技術は、主に二つのアプローチに分類される:ノイズに強い関数の開発、またはノイズデータを検出することでラベルをクリーニングする手法の利用である。近年、ノイズクリーニング手法がノイズラベル学習において最も競争力のあるアプローチと見なされるようになっている。しかし、これらの手法のノイズラベル検出器は、理論的根拠よりもヒューリスティックに設計されることが多く、正確なラベルを予測するためのロバストな分類器が損失値を用いてノイズデータを識別する必要がある。本論文では、ラベルノイズをフィルタリングするための新しい検出手法を提案する。既存の多くとは異なり、我々は各データの潜在表現の動的変化に着目し、データのグラム行列の固有値分解を用いて、潜在分布と各表現との整合性を測定する。本研究で提唱するフレームワーク「FINE(Filtering Noisy Instances via their Eigenvectors)」は、微分を必要としないシンプルな手法でありながら、理論的な保証を持つロバストな検出器を提供する。本フレームワークに基づき、FINEを活用した三つの応用を提案する:サンプル選択アプローチ、半教師付き学習アプローチ、およびノイズロバスト損失関数との連携。実験結果から、さまざまなベンチマークデータセットにおいて、三つの応用すべてにおいて提案手法が対応するベースラインを一貫して上回ることが確認された。