17日前

異分散性および不均衡なディープラーニングにおける適応正則化

Kaidi Cao, Yining Chen, Junwei Lu, Nikos Arechiga, Adrien Gaidon, Tengyu Ma
異分散性および不均衡なディープラーニングにおける適応正則化
要約

現実世界の大規模データセットは、ヘテロスケダスティック(分散が不均一)かつ不均衡な特徴を有しており、ラベルには異なるレベルの不確実性が伴い、ラベル分布は長尾型を呈する。このようなヘテロスケダスティシティと不均衡性は、誤ラベル付けされた例、曖昧な例、希少な例を区別する困難さにより、ディープラーニングアルゴリズムに大きな課題をもたらす。一方で、ヘテロスケダスティシティと不均衡性を同時に扱う研究はまだ十分に行われていない。本研究では、ヘテロスケダスティックなデータセットに対して、入力空間の異なる領域に応じて異なる正則化を施すデータ依存型正則化手法を提案する。一次元非パラメトリック分類設定における最適正則化強度の理論的導出に着想を得て、本手法は不確実性が高く、密度が低い領域のデータポイントに対してより強い正則化を適応的に適用する。我々は、WebVisionを含む複数のベンチマークタスク上で本手法を検証した。実験結果は理論の妥当性を裏付け、ノイズに強いディープラーニングにおける他の手法と比較して顕著な性能向上を示した。