
要約
ノイズのあるラベルを用いた学習(LNL)は、ラベルが汚染された訓練データセットにおいてもモデルの汎化性能を確保することを目的としています。本研究では、細分類データセットにおけるLNLのあまり研究されていない状況(LNL-FG)に着目し、細分類クラス間の大きなクラス内曖昧性がより多くのノイズラベルを引き起こすため、実用的かつ挑戦的な状況であることを示します。実証的に、従来のLNLで良好な性能を発揮する手法がLNL-FGにおいては満足のいく結果を得られないことを明らかにし、LNL-FGに対する有効な解決策の実用的必要性を示しました。これに対応して、識別可能な表現を促進することでラベルノイズに対処する新たなフレームワークである「確率的ノイズ耐性を持つ教師付きコントラスト学習(SNSCL)」を提案します。具体的には、ノイズラベル補正に向けた重み認識メカニズムを組み込んだノイズ耐性のある教師付きコントラスト学習損失関数を設計し、モメンタムキューの選択的更新を実現しました。このメカニズムにより、ノイズを含むアノテーション(アンカー)の影響を軽減し、モメンタム更新によってキューにノイズラベルが挿入されるのを回避します。さらに、コントラスト学習における手動で定義された増強戦略を回避するため、生成された分布から特徴埋め込みを確率的にサンプリングする効率的な確率的モジュールを提案しました。このモジュールは深層モデルの表現能力を向上させる効果も持っています。SNSCLは汎用性があり、既存の強力なLNLロバスト戦略と互換性を持ち、それらのLNL-FGにおける性能を向上させることができます。広範な実験により、SNSCLの有効性が実証されています。