
要約
現実世界のデータにおいて、ラベルノイズとクラス不均衡はしばしば共存する。しかし、従来のロバスト学習に関する研究は、通常、これらのデータバイアスのうち一方のみに着目しており、両方の問題に直面した場合には性能が低下する傾向がある。このギャップを是正するために、本研究では、学習プロセスに応じて目的関数を自動的に調整する新たなメタラーニングに基づく動的損失関数を提案する。具体的には、本動的損失関数は、ノイズのあるラベルを補正するラベル補正器と、データの背後にある分布および分類器の学習状態を捉え、クラスごとに追加的な分類マージンを生成するマージン生成器から構成される。さらに、少量の偏りのないメタデータを多様で困難なサンプルで豊かにする新しい階層的サンプリング戦略を導入することで、動的損失の2つの構成要素がメタラーニングにより共同最適化され、分類器がクリーンでバランスの取れたテストデータに良好に適応するよう育成される。広範な実験の結果、本手法はCIFAR-10/100、Animal-10N、ImageNet-LT、Webvisionなど、さまざまなタイプのデータバイアスを含む複数の実世界および合成データセットにおいて、最先端の精度を達成した。コードはまもなく公開される予定である。