
弱いまたはノイズの多い教師信号を活用して効果的な機械学習モデルを構築するという課題は、長年にわたり重要な研究テーマである。近年、深層学習モデルの訓練に大規模なデータセットが必要とされる傾向が高まる中で、その重要性はさらに増している。弱いまたはノイズの多い教師信号の源としては、専門外のラベリング者や、ヒューリスティクスに基づく自動ラベリング、あるいはユーザーのインタラクション信号など、多様なものが挙げられる。ノイズを含むラベルを活用するための前例の多い研究が存在するが、特に最近の研究では、メタラーニングを用いたインスタンス再重み付けアプローチによって顕著な性能向上が報告されている。このアプローチでは、メタラーニングフレームワークを用いてノイズラベルに対するインスタンス重みを学習している。本論文では、このアプローチをさらに発展させ、メタラーニングフレームワーク内においてラベル補正問題として定式化することにより、新たなアプローチを提案する。具体的には、ラベル補正プロセスをメタプロセスとして捉え、ノイズラベルを補正するラベル補正ネットワークをメタモデルとして採用し、その補正ラベルを用いて主モデルを学習するという新しいメタラーニングベースのフレームワーク、MLC(Meta Label Correction)を提案する。この場合、ラベル補正ネットワークと主モデルは、二段階最適化問題を共同で解くことで同時学習される。画像認識およびテキスト分類という二つのタスクにおいて、異なるノイズレベルと種類を用いた広範な実験を実施した。再重み付け手法と補正手法を比較した結果、補正フレームワークが再重み付け法のいくつかの限界を克服できることを示した。また、提案手法MLCが、多くの設定において従来手法と比較して顕著な性能向上を達成できることも明らかにした。