8日前

Peer Loss Functions:ノイズラベルから学習するための手法—ノイズ率を事前に知らなくても可能

Yang Liu, Hongyi Guo
Peer Loss Functions:ノイズラベルから学習するための手法—ノイズ率を事前に知らなくても可能
要約

ノイズを含むラベルを用いた学習は、教師あり学習における一般的な課題である。従来のアプローチは、ラベルノイズの深刻さを制御するパラメータとしてノイズ率を事前に指定する必要があり、その指定は仮定に基づくか、追加の手順を用いて推定されることが一般的である。本研究では、新たな損失関数の族である「ピア損失関数(peer loss functions)」を提案する。この損失関数は、ノイズを含むラベルからの学習を可能にするとともに、事前にノイズ率を指定する必要がないという特徴を持つ。ピア損失関数は標準的な経験的リスク最小化(Empirical Risk Minimization; ERM)フレームワーク内で動作する。本研究では、やや緩い条件下で、ノイズを含むデータセット上でピア損失関数を用いたERMを実行することで、実際にはアクセスできないクリーンな訓練データ上でERMを実行した場合と同等、あるいは近似最適な分類器が得られることを示す。さらに、広範な実験を通じて本手法の有効性を検証した。ピア損失関数は、潜在的にノイズを含む訓練ラベルに直面した際のモデル開発を簡素化する手段を提供し、このような状況におけるロバストな損失関数として推奨できる。